大模型能力仍在不断突破,智能系统的竞争焦点却已悄然转移——从“模型能力竞争”走向“系统能力竞争”。在这一关键转折点上,基模与Agent(智能体)的关系成为学术界与产业界共同关注的焦点:Agent究竟只是阶段性的工程框架,还是未来智能体不可或缺的核心架构?

2026年6月7日下午,由中国计算机学会(CCF)主办、CCF YOCSEF杭州学术委员会组织的“基模与Agent:智能系统的边界之争、评估之变与进化之路”技术论坛在杭州市余杭区阿里巴巴西溪C区举行。论坛汇聚了来自高校与企业的多位专家学者,围绕基模与Agent的能力边界、评价标尺、协同进化三大核心议题展开了深度思辨。

论坛由CCF YOCSEF杭州AC陈佳伟与主席刘佐珠共同主持。在论坛发言环节,四位学者分别从不同维度分享了最新研究成果与思考,多元视角透视大模型与智能体的发展现状和未来。

现场,北京大学深圳研究生院助理教授袁粒聚焦多模态基础模型,探讨了生成与理解协同统一的可能路径。阿里巴巴资深算法专家朱达则结合通义千问C端实践,分享了Agent Harness在搜索、推荐以及处理复杂任务中的思考与探索。中国科学技术大学特任教授张岸从大模型内部机制解码切入,探讨了智能体自进化的实现路径。

在随后的思辨环节,与会嘉宾围绕“基模VS Agent,哪些智能体能力会被基模吞噬,哪些会被保留?”“评价标尺之变——Benchmark失效之后怎么办?”“协同进化之路——如何驱动基模与Agent高效进化?”等话题,现场展开了激烈讨论。

部分嘉宾认为,随着基模的持续Scale Up,原本属于Agent层的规划、记忆、工具调用等能力正逐渐被基模“内化”;也有嘉宾指出,Agent的价值会随着基模的进化而提升,关键不在于“拥有”多少能力,而在于如何在复杂开放环境中“组织”和“调度”这些能力。

如今,在全球AI模型与智能体群雄逐鹿、飞速迭代之下,当传统的Benchmark打榜模式逐渐失效,如何高效、可靠地评估基模与智能体的真实性能,成为又一讨论热点。

浙江大学计算机学院研究员陈佳伟告诉记者,现在基模和智能体能力正在不断迭代,但落地应用还有许多问题待解决。我们举办本次技术论坛,是想探讨基模和智能体能达到何种能力,以及梳理出比较好的技术路线。

“现在市面上有很多模型在Benchmark上跑分都挺高,但在工业落地时,我们发现高分并不等于高能,我们想探讨在开放动态场景下如何更好地评估模型,在技术和实际应用之间搭建一个桥梁。”陈佳伟说,杭州有天然优势,比如很多的AI企业,也有一些比较好的高校,大家可以一起去联合去研发和探讨。

阿里千问事业部学术合作负责人徐碧璘告诉记者,当前技术发展非常快,今年出现了很多新的技术范式,尤其是Agentic的能力,能让用户更快速地接入AI,让大家更好地使用AI。

“从科技普惠的角度来看,用户在辅导孩子写作业时有更好的工具,或是在求医问药时有更好的参考,我们的最终目的,是用更好的技术范式去推动产品的进步,去满足用户的多样需求。”徐碧璘说。

论坛持续四个多小时,现场讨论热烈,观点交锋频繁。与会者认为,基模与Agent的关系并非简单的替代或对立,而是一个动态演进、相互塑造的过程。随着智能系统从“模型能力竞争”进入“系统能力竞争”,如何设计更稳定、高效、可评估的基模和Agent架构,如何建立面向真实复杂场景的评测体系,将成为下一阶段技术突破的关键。

本次论坛得到浙江省人工智能学会和阿里巴巴ATH-千问事业群支持。

会议还邀请了浙江大学教授李玺、中国人民大学副教授刘勇、小红书大模型负责人曹绍升、浙江大学软件学院副教授张宁豫、蚂蚁集团高级算法专家胡斌斌等高校和企业界嘉宾100余人现场参会。

球盟体育官网,球盟会,

球盟会官网入口相关资讯:球盟会网站,