分论坛 > 南京 > 新闻动态
YEF2025专题论坛 | 大模型时代下AI Agent将重塑智能化应用,但挑战犹存,需学界和业界协同突破
2025-05-30 阅读量:3 小字


    2025年5月22日下午,YEF 2025专题论坛 “大模型驱动新一代AI Agent技术变革:挑战与趋势”在珠海横琴湾会议中心成功举行,会议邀请了香港大学助理教授黄超、上海交通大学长聘教轨助理教授张倬胜、上海人工智能实验室研究员王文海、蚂蚁研究院研究员郑达以及vivo技术专家苏涛共计五位青年专家学者,围绕大模型时代下AI Agent的发展现状、存在的问题与挑战以及未来发展趋势等议题展开深入交流与讨论。论坛设置了嘉宾报告分享与Panel讨论环节,现场氛围热烈,参会人数达40余人。论坛由YOCSEF南京现任主席、南京大学特聘研究员朱光辉主持。

图1 论坛现场

论坛执行主席朱光辉首先介绍了论坛背景。大模型时代下AI Agent逐渐成为学界和业界关注的热点,正从工具向“自主智能体”演进,有望将对数字信息技术行业带来颠覆式的影响。但是,已有AI Agent仍存在明显不足,在一些通用开放任务上表现较差,离真正的落地应用仍具较大的提升空间。朱光辉以旅行助手智能体为例,指出一款能够综合考虑用户出行习惯、日程安排、天气信息等因素的智能旅行助手智能体能够大幅提升旅行规划的便捷性以及效率,然而现有旅行助手智能体的开发还处于起步阶段,远没有达到落地应用要求。为此,论坛围绕大模型AI Agent技术现状以及核心技术路线、目前面临的主要问题与挑战、技术与应用的发展趋势三个方面,展开思辨讨论。

在报告分享环节,香港大学助理教授黄超首先作题为《大模型智能体: 从语言到行动》的技术报告。他指出当前大模型仍面临着幻觉、推理能力不足、知识更新不及时等问题,Agent智能体通过引入领域知识库、外部工具以及人在回路的交互机制,可以弥补大模型的不足。大模型与Agent的结合,将成为AI发展的下一波浪潮。接着,他介绍了基于RAG(Retrieval-Augmented Generation)的大模型智能体,包括轻量化RAG框架LightRAG、面向端侧应用的MiniRAG以及具备多模态理解能力的VideoRAG。为了提升大模型智能体的构建效率,黄超介绍了团队自研的全自动化、零代码的大模型智能体开发框架AutoAgent。最后,他分享了一系列大模型智能体应用,如视频编辑工具AI-Creator、GUI 智能体Aria-UI以及面向科研领域的AI-Researcher。

上海交通大学长聘教轨助理教授张倬胜围绕端侧OS Agent,作了题为《面向复杂对抗场景的端侧OS Agent技术探索》的技术报告。他认为大模型智能体的能力突破,将成为新焦点,能够极大拓展大模型能力边界和应用场景。另外他也指出了大模型智能体的内涵,即能够动态指导其自身流程和工具使用的系统,并根据实时反馈调整自身的操作。接着,张倬胜介绍了OS Agent,该智能体是一种能够主动规划决策,模拟人类行为(如点击、滑动、输入),完成信息获取和功能执行的智能体,并且提出了首个专门针对GUI智能体复合任务设定的全面测试基准。最后,他也分享了OS Agent所面临的可靠性风险以及安全风险,如指令过度执行以及环境注入攻击,并且提出了一种基于层级放缩的安全增强机制。

上海人工智能实验室研究员王文海从多模态感知理解的角度,分享了题为《多模态大模型及其在AI Agent中的应用》的报告。他首先指出多模态大模型有望在众多领域带来AI生产力革命,并介绍了书生万象多模态大模型,其采用60亿参数规模的视觉基础模型,通过渐进规模训练,实现与大语言模型的对齐,模型“由小到大”,数据“有粗到精”,以较低成本完成了百亿参数级别多模态大模型的训练,达到了比肩商用多模态大模型的性能。接着,王文海介绍了多模态大模型在AI Agent中的应用,他指出借助多模态大模型,AI Agent能够有效感知外部环境,并通过Agent框架中的记忆系统、任务系统与工具系统,解决现实场景中的复杂任务,并以GUI Agent及具身智能场景为例,介绍了多模态大模型与外部环境的交互方式与交互流程。

蚂蚁研究院研究员郑达针对数据科学应用场景,分享了题为《AutoMIND: 面向数据科学的知识增强智能体》的技术报告。数据建模包含数据分析、任务解析、算法设计、代码生成、模型训练与评估等复杂流程,AI智能体能否向人类AI科学家一样开发复杂的ML算法,解决复杂的ML任务呢?郑达给出了相应的解决方案,他介绍了基于AI 智能体的数据建模框架AutoMIND,首先引入多样化的数据建模知识,包括Kaggle平台中ML建模技巧、LLM本身包含的ML建模知识以及代表性ML论文中的ML建模知识,接着通过自适应代码生成技巧,尽可能保证复杂ML算法代码生成的正确性。最后,通过基于树的ML算法探索不断尝试更好的ML算法。郑达介绍,AutoMIND在各种ML任务上都能大幅超过已有的数据科学Agent,而且知识增强生成的模型在更难的ML任务上具有更大的性能提升。

vivo安全技术专家苏涛结合自身的行业经验,分享了题为《面向端侧智能体安全需求的技术体系架构》的技术报告。他首先指出2025年以来,AI智能体开始进入手机终端,在手机端部署的AI智能体与传统的AI助手最大的区别是,AI智能体能够理解用户的意图,实现自主化操作,而且AI 智能体有望成为网络流量分发核心。然而,端侧AI 智能体也面临着严重的安全风险,例如用户隐私数据的保护、智能体行为的管控等。对此,苏涛也介绍了相应的解决方案,在数据保护层面,基于用户数据分类分级以及数据授权智能体,动态限制用户数据的使用;在智能体管控方面,通过可信度量以及可信执行环境,实现智能体的可靠运行。



图2 嘉宾报告

报告分享环节之后,论坛进入Panel讨论环节。论坛设置了四个思辨议题,报告嘉宾与现场参会人员围绕思辨议题,进行了热烈讨论,不同观点之间相互碰撞和补充,现将思辨议题的讨论结果整理如下:

图3 Panel讨论

议题一:大模型时代下AI智能体的定义和内涵是什么?

    大模型时代下,有很多人质疑AI智能体就是“套壳”大模型,那么大模型和AI智能体的区别在哪里?AI智能体是不是大模型?为此,论坛围绕AI智能体的定义和内涵展开讨论。参会人员一致认为AI智能体不是大模型,两者不能划等号,两者的定义和内涵完全不同。大模型仅仅是AI智能体的知识基座,AI智能体的内涵应该包含四个方面:1)自主性,能够对任务进行自主分析、推理和规划;2)交互性,能够自动感知多模态的外部环境,并且能够将输出反馈到外部环境;3)主动性,能够主动行动,通过主动调用外部工具或者外部服务,实现决策的自动执行;4)进化性,能够持续学习和经验积累,实现自我进化,提升规划和决策的智能化水平。根据AI智能体的内涵,AI智能化可呈现出多样化的不同规模的外部表现形式,例如满足特定功能的智能化应用(如旅行规划Agent)、支持多样化功能的智能化系统(如Manus、GUI Agent)等。


议题二:AI Agent和大模型之间是什么关系?

    既然AI Agent和大模型之间不能划等号,那么两者之间存在什么相互关系呢?为此,论坛进一步围绕AI智能体与大模型的相互关系展开讨论,总体结论是AI Agent和大模型之间是相辅相成的关系。一方面,大模型是AI 智能体的知识基座,AI智能化的规划和决策过程依赖大模型背后蕴含的海量知识,大模型的能力越强、知识越丰富,AI Agent的智能化水平也会越高。因此,大模型能够为AI Agent的构建提供基础支撑能力。另一方面,AI Agent也能够弥补大模型易产生幻觉、领域知识不足、无法调用外部工具等方面的不足,例如可通过检索增强技术引入外部知识、通过MCP协议实现外部工具调用、通过A2A协议实现多智能体之间的协同等。更重要的是,AI Agent通过充分发挥大模型的能力,为大模型找到了一个具有广泛应用空间的出口,让大模型真正有“用武之地”。


议题三:AI Agent存在哪些关键技术问题?

    AI Agent具有极大的落地应用价值,将成为AI应用的下一个风口,引起了学界和业界的广泛关注。那么从技术层面上看,AI Agent存在哪些关键技术问题??为此,论坛围绕AI Agent存在的关键技术问题展开讨论,总体结论是AI Agent需要解决五个方面的关键技术问题:1)任务分解与规划,该技术是体现AI Agent自主性的关键核心;2)长期记忆,该技术能够有效解决AI Agent长程规划能力不足、个性化水平不够、历史经验无法充分利用的问题;3)决策与执行,该技术能够主动调用外部工具和服务,实现决策的自动执行,如何提升决策执行的正确性以及外部工具调用的准确性仍是亟需解决的问题;4)多智能体协同,该技术通过多个智能体之间的协同,可以有效弥补单智能体能力不足;5)智能化安全。随着AI智能体的不断落地应用,尤其是端侧GUI Agent,如何实现用户隐私数据的保护以及智能体的可信可靠执行,也逐渐成为迫切需要解决的问题。


议题四:如何基于AI Agent与大模型构建未来智能化应用服务?

    大模型与AI Agent的兴起,对现有的智能化应用以及服务带来巨大的冲击,现有的智能化应用需要重塑,需要主动拥抱AI Agent和大模型。为此,论坛最后一个议题将讨论如何基于AI Agent与大模型构建未来智能化应用服务,主要聚焦未来智能化应用服务的智能水平提升以及系统架构变革两个维度。在智能化水平提升方面,未来应用软件必须要引入大模型与AI Agent,利用大模型和AI Agent的交互、感知、理解、决策以及行动能力,提升软件的智能化水平、可交互性以及可操作性。在系统架构变革方面,未来智能化应用需要拥抱MCP(模型上下文协议,Model Context Protocol)协议。MPC协议是一种标准化接口,旨在实现人工智能模型与外部工具和资源的无缝交互,已逐渐成为 AI生态的“通用插座",MCP 有望成为未来AI Agent构建的标准接口和框架。最后,参会嘉宾一致认为,大模型+AI Agent+MCP正在重塑未来智能化应用的模式与产业生态,学界和业界需要一起努力,从技术研究、产品开发、生态构建等多个方面,共同打造新一代智能化应用服务。

图4 参会人员合影

论坛最后由朱光辉进行总结。本次论坛吸引了来自学术界与产业界等参会者的关注,嘉宾报告内容干货满满,从不同的视角介绍了大模型时代下AI Agent的技术与应用现状、存在的问题与挑战。在Panel讨论环节,现场讨论氛围热烈,不同观点相互交错和碰撞。与会嘉宾普遍认为,大模型时代下,AI Agent具有和大模型不一样的内涵,落地应用价值巨大,但是也存在诸多关键技术问题,大模型+AI Agent+MCP的三重组合将重塑未来智能化应用的模式与产业生态。未来,需要通过产学研用协同创新发展,解决大模型与AI Agent关键技术问题,打造一批可用好用的AI Agent工具和产品,共同推动AI Agent的行业落地应用,赋能行业智能化水平的快速提升。


热门动态
2025-01-20
信息爆炸时代下,推荐算法的广泛使用解决了信息过载问题,但同时...
2025-01-19
2025年1月12日,中国计算机学会青年计算机科技论坛南京分论坛(...
2024-12-16
大学生作为一个特殊社会群体,面临着学业、就业、人际关系等多重...
2024-11-18
2024年11月09日,CCF YOCSEF南京钟山论剑观点论坛——“智法新时...
2024-11-05
2024年10月26日,CNCC 2024技术论坛:“探索大语言模型的潜能与...
2024-08-25
2024年8月18日,CCF YOCSEF南京钟山论剑观点论坛——“从‘循序...
2024-07-10
2024年6月22日,中国计算机学会青年计算机科技论坛南京分论坛(...
2024-07-10
2024年6月16日,由CCF YOCSEF南京举办的“大模型赋能材料科学创...
2024-06-03
      习近平总书记在黑龙江考察期间首次提出的“新质生产力”理...
2024-05-30
2024年4月20-21日,CCF YOCSEF南京不负春光,在南京市江宁区花筑...
2024-03-19
2024年考研成绩新鲜出炉,今年的考研人数虽然有所下降,但也达到...
2024-01-18
参会人员集体合影留念2024年1月14日,中国计算机学会青年计算机...
2023-12-26
2023年12月16日,CCF YOCSEF南京在南京市江宁区数动未来空间举办...
2023-11-24
2023年11月4日,由CCF YOCSEF南京举办的“计算机技术如何助力青...
2023-08-27
2023年8月19日,CCF YOCSEF南京在南京邮电大学仙林校区计算机学...
2023-08-14
2023届毕业生达历史之最的1158万人,而当下的考研人数越来越多,...
2023-08-10
2023年7月25日,CCF YOCSEF南京成功举办了钟山论剑技术论坛“打...
CCF聚焦