首页 十大品牌文章正文

专访信通院孙鑫:大模型快速迭代需软硬件深度协同|四中全会预热

十大品牌 2025年10月18日 10:16 0 admin

21世纪经济报道记者周潇枭 见习记者冉黎黎 北京报道10月15日,国务院以“强化标准引领保障作用,以标准升级促进经济高质量发展”为主题,进行第十六次专题学习。国务院总理李强强调,强化人工智能等数字技术赋能,系统推进标准制定修订。

同日,工业和信息化部部长李乐成在北京会见美国苹果公司首席执行官蒂姆·库克时表示,中国将坚定不移推进高水平对外开放,大力推进“智能产业化”和“产业智能化”。

人工智能发展受到高度重视。展望“十五五”,如何深入推进“智能产业化”和“产业智能化”?如何看待人工智能在不同行业渗透深度存在的差异?未来还会持续涌现“更强模型”吗?针对相关问题,21世纪经济报道记者专访了中国信通院人工智能所副总工程师孙鑫。

孙鑫主要从事人工智能、信息通信、科技创新等领域研究,曾主持参与多项省部级课题和决策咨询专项,核心支撑人工智能、科技创新等多项国家重大战略。

孙鑫表示,人工智能领域有几个重要趋势,其中之一是软硬件深度协同、高效融合成为大模型研发新范式。未来,极致的软硬协同将是支撑大模型快速迭代的关键所在。同时,智能体成为大模型应用的主要形态,正在加速形成智能体经济。

智能体是数字员工的初级形态。当前智能体相比大模型能够自主完成复杂任务,可以获得比单一模型更好的性能表现,但能力仍有很大提升空间,推动互联互通和长难任务处理是当前智能体技术创新的主旋律。

另外,人工智能赋能行业的路径符合“从数字化水平较好的领域率先突破,再逐步扩散到更多行业”的推进特征。当前,人工智能在不同行业的渗透深度存在差异是客观现实。在推进行业应用过程中,需要关注两个方面的协调统一,即行业水平与转型路线的协调统一、技术能力与实际需求的协调统一。

《21世纪》:在“十四五”已打下的基础之上,“十五五”期间如何进一步推进“智能产业化”和“产业智能化”?

孙鑫:要加快推动人工智能向现实生产力转化,重点既在技术创新,也在应用牵引,需要一体化布局。最近一年,我们观察到人工智能领域几个重要趋势。

一是基础大模型迭代速度加快,新技术创新路径蓄势待发。中国信通院“方升”大模型基准测试数据显示,全球大模型迭代速度不断加快。去年以来,多模态模型理解能力整体提升90%,TOP1模型迭代周期从去年的几个月缩短至几周。

二是软硬件深度协同、高效融合成为大模型研发新范式。人工智能前沿创新离不开强大的算力底座,需要模型与芯片、框架、服务器、网络等软硬件体系紧密协同。现在大模型训练和推理计算量仍保持高速增长,对智能计算提出更高需求,单靠智算芯片硬件的提升无法达到这么快的增速,也面临越来越大的能源消耗瓶颈。未来,极致的软硬协同将是支撑大模型快速迭代的关键所在。

三是智能体成为大模型应用的主要形态,正在加速形成智能体经济。目前,市场上涌现出了多种智能体形态。越来越多的行业用户把开发垂直行业智能体作为人工智能应用的主要方向。人工智能手机、具身智能机器人等产品也成为搭载智能体的新型设备。智能体产业链不断完善,成为智能经济的重要支撑力量。

四是开源带动“群体进化”和人工智能普惠发展。特别是今年春节以来,开源模型的发展,进一步激活公有云、一体机等AI市场,基于开源的衍生模型日益繁荣,极大降低了大模型落地应用的门槛,为人工智能发展带来新机遇。

《21世纪》:未来还会持续涌现“更强模型”吗?这种“更强”将主要体现在哪些维度?

孙鑫:近期人工智能所研究团队对当前及未来一段时间的发展方向进行了深入观察,可以从中找到模型能力增强方向的几点思考。

基础模型方面,语言基础超级模型开始深度集成多种能力,模型推理能力成为衡量模型“聪明”与否的重要指标。

其中,头部大模型表现出显著的集成特征,一方面通过路由融合集成多种关键能力,可根据任务需求自动激活模型的思考或非思考能力,大幅提升运行效率,降低计算的成本;另一方面通过与真实的业务场景交互,基于Agentic RL(面向智能体的强化学习)技术赋予模型自主规划、调用工具、因果推断能力,提升在应用场景中的表现。多模态大模型深度融合理解和生成能力,原生多模态架构逐渐走向成熟。

智能体方面,加速从感知认知向自主决策执行演进,成为大模型应用的主要形态。中国信息通信研究院“方升”智能体基准测试结果显示,当前智能体相比大模型能够自主完成复杂任务,可以获得比单一模型更好的性能表现。

世界模型方面,作为AI系统理解、推理并预测物理世界的“内部模拟器”,世界模型加速构建数据生成、动作解释、环境交互、场景重建四类核心能力。目前主要有三条技术路线。

一是聚焦大模型增强,如OpenAI的Sora、谷歌Genie系列模型等,这类模型融合Transformer与Diffusion,正成为构建数字世界的“模拟器”。

二是大模型与物理引擎融合,如World Labs的Marble、腾讯HunyuanWorld-Voyager等,这类模型锚定物理规则、赋能高可靠生成,打造可解释的世界预测范式。

三是其他路径的探索,如Meta的JEPA系列,这类模型抛弃像素级生成,专注于学习世界的抽象表征与预测潜在状态。

虽然世界模型的发展还面临不少挑战,但未来具有泛化能力强、物理一致性高、可解释性强的“通用世界模型”将成为学界与业界共同努力的目标,最终成为AI通向AGI(通用人工智能)的关键基石。

具身智能方面,接下来,场景驱动下的数据-模型-本体的三位一体联合设计与闭环优化,正逐步成为具身智能产业创新发展的关键路径。具身智能将以突破具身图灵测试为目标,实现生物级感觉运动能力,并在复杂动态的环境中展现出前所未有的灵活性和适应性。

AI未来发展路径仍有很大不确定性,大胆预测的话,或许有如下几个可能性。

一是强化学习等机器学习技术取得重大突破,世界模型技术路径逐步清晰。

二是新的模型架构出现。效率更高、性能更好,或者可信水平更高的非Transformer架构出现。

三是新型计算技术走向实用。目前还在实验室的光计算、类脑计算、量子计算、生物计算等新兴计算技术一旦投入实用,将会带来人工智能技术体系的重构。

《21世纪》:2025年被视为智能体元年。未来智能体发展具有怎样的提升和想象空间?

孙鑫:智能体是数字员工的初级形态。智能体有丰富的想象空间,但能力仍有很大提升空间,推动互联互通和长难任务处理是当前智能体技术创新的主旋律。

一方面,通信协议成为智能体与外界交互的“桥梁”,扩展模型能力边界。MCP、A2A等智能体通信协议可以降低系统集成复杂性,解决数据孤岛问题。今年以来,智能体网络也受到了越来越多的关注,但其落地推广仍面临一定挑战。

另一方面,智能体发展还需要提升长时间执行复杂任务的能力。长程性体现了智能体在跨越较长时间周期的复杂任务中达成目标的能力。相关研究显示,过去两三年,智能体能完成任务的长度大约每7个月翻一番。当前,国内企业进行了不同程度的探索。未来,智能体将能够独立完成大量需要人类数天或数周才能完成的任务,加速开启智能原生应用时代。

《21世纪》:对于实现新型工业化这一关键任务,发展人工智能是必答题而非选择题。目前,人工智能在不同行业的渗透深度和效果存在差异,如何看待这种差异?展望“十五五”时期,是否有必要主动拉平这种差异?

孙鑫:从发展规律和应用态势来看,人工智能赋能行业的路径符合数字技术应用的一般客观规律,即遵循“从数字化水平较好的领域率先突破,再逐步扩散到更多行业”的推进特征。

一方面率先在数字原生领域规模化应用,以互联网为代表的数字原生领域,凭借天然的数据沉淀优势、成熟的数字基础设施以及海量的用户基础,率先形成人工智能应用的规模化落地。例如,互联网搜索、社交、购物、写作、编程等领域纷纷接入大模型、拓展新业态,这些应用不仅提升了服务效率,还为用户带来了全新的交互体验。

另一方面逐步向金融、医疗、交通等数字化程度较高的行业渗透,重要场景应用赋能成效显著。比如,人工智能在自动驾驶的应用也随着大模型的发展正实现新的突破。这些先导应用都建立在行业既有的数字化基础之上,同时也加速了相关行业的数字化向智能化的重构进程。随着人工智能技术的进一步普惠化和各行业数字化转型的全面推进,人工智能将在制造、能源更多实体经济领域实现深度应用,与更加复杂的物理场景和核心生产流程相结合,推动生产力更大的变革性突破。

当前,人工智能在不同行业的渗透深度存在差异是客观现实。人工智能技术发展速度“一日千里”是本轮人工智能发展的重要特点,不同行业的数字化转型基础、资源供给能力、对人工智能的认识等相关情况均不一致,一定程度上影响了人工智能在不同行业中的应用速度。

在推进行业应用过程中,需要关注两个方面的协调统一,即行业水平与转型路线的协调统一、技术能力与实际需求的协调统一。坚持市场驱动,结合场景价值、技术特征等因素因业施策,制定符合企业实际的智能化转型路线。可以在基础好、需求大的高价值场景先行先试,从资源、技术、治理、体制机制等不同方面突破落地卡点、堵点、难点,形成示范带动效应后扩大场景范围。

更多内容请下载21财经APP

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap