首页 AI科技文章正文

下一代大模型(GPT-5):研究框架

AI科技 2025年08月05日 02:56 0 admin

文|杨泽原 许英博 丁奇 马庆刘

下一代大模型(如GPT-5),有望成为决定本轮AI产业前景的关键变量。我们基于学术与产业界现有的成果与研讨方向,尝试建立下一代大模型的研究框架,从模型基座、性能、生态、产业等角度展开分析,期待其有望以2-3倍参数规模,实现近10倍智能水平,并显著提升推理性价比。同时,下一代大模型在逻辑推理、原生多模态、记忆系统等关键能力突破,将加速高价值复杂行业场景应用落地。产业端,Agent和多模态两大主线有望持续引领,建议关注企业管理、教育、医疗等领域的头部公司,与海量推理带动的算力产业机遇。

报告缘起:

我们以关键测试集上错误率减半、智能水平提升10倍作为模型跨代的重要标准。站在当前时点,前瞻性地展望并分析下一代大模型(如GPT-5),是具有难度的。但下一代模型对产业发展具有核心关键意义,其在逻辑推理、多模态等方面能力的持续迭代进展,将显著影响下游应用商业化可行性与进度。因此,我们基于学术与产业界现有的成果与研讨方向,尝试建立下一代大模型的研究框架,从模型基座、性能、生态、产业等角度展开分析,并就相关性能表现及影响进行初步展望,为产业界、投资界分析预判下一代模型变革提供参考。

▍研究角度1——模型基座:模型规模扩增2-3倍实现10倍智能,推理性价比提升一倍提升应用盈利潜力。

结合Densing Law,新一代模型或需要2-3倍的参数规模实现跨代效果,对应模型参数规模约3-5万亿。数据规模上,当前文本数据应该足以支撑下一代模型训练,多模态和思维链数据规模和质量提升有望成为产业新需求。结合当前MoE架构设计和总参数规模假设,预计模型单次激活参数规模或在2000-3000亿水平,较GPT-4单次激活2770亿的规模相比,新一代模型单次推理的算力消耗无大幅增加,API价格或较GPT-4o仅小幅增长甚至不增长,推理性价比提升一倍以上,带动AI应用盈利能力大幅改善。

▍研究角度2——性能展望:逻辑推理、原生多模态、记忆系统等关键能力突破,加速高价值复杂行业场景应用落地。

1)逻辑推理:准确性和创造力有望同步提升,高价值、低容错应用场景落地可期。以思维链为基础的逻辑推理能力从数理等可验证领域泛化到文科等不可验证领域;通过更完善的工具使用和思维链学习,从复现历史逻辑进化到尝试在新领域解决新问题。用户指令跟随升级提升思维链生成稳定性,更好满足B端低容错场景应用,利好企业端Agent加速落地,AI coding作为落地最快的领域之一有望实现更好盈利能力。

2)原生多模态:期待实现更好的实时动态视频交互和处理能力。原生多模态具有更好的多模态信息融合能力,并且方便多模态模型规模快速扩增,或是下一代模型的主流选择,目前该架构有望迎来加速发展拐点,中长期或将带动模型规模新一轮扩增。模型将实现从静态图像向实时视频处理的进步,推理延迟降低一半;同时从信息识别向分析推理发展,提升数理领域和规划分析效能。

3)记忆系统:长上下文带动30%+任务完成量提升,助力打造专属个性化助理。短记忆以长上下文为基础,下一代模型实现千万Tokens长上下文,短记忆升级带动单次任务完成效率大幅提升,单轮对话任务完成率潜在提升空间30%+,任务耗时有望下降到此前的1/3。长记忆以向量化为基础,多模态向量化技术突破让模型记住视觉信息,多智能体跨平台跨终端协同方案加速探索。长短结合的记忆系统形成全局记忆,让模型成为每个用户的个性化私人助理。

▍研究角度3——生态发展:模型融合降低推理成本,生态建设加速应用开发。

模型层,针对问题类型实现思维链和非思维链模式无缝切换,我们预计到下一代模型推出以后有望节约18%+的推理算力成本。基座模型和通用工具原生整合,压缩单点工具和第三方通用Agent产品空间,有数据、经验、入口壁垒的行业场景将是第三方厂商的优势领域。生态上,单智能体开发工具链、多智能体协同框架持续完善,MCP、A2A等协议快速融合各领域的最佳实践,生态支持每家企业都可以快速定义符合自身业务场景需求的类Manus产品。

▍研究角度4——产业影响:多模态和Agent两大主线有望引领应用落地,推理需求扩容带来的算力产业新机会。

1)Agent:企业管理软件仍是最佳场景之一,关注25Q4开始的业绩表现。模型逻辑推理性能带动长流程复杂任务能力提升,推动行业内Agent价值提升,企业管理软件仍是AI Agent落地的最佳场景之一,我们预计其在中期讲打开4倍空间,Q4开始AI应用的业绩贡献将逐步体现,建议关注AI在企业管理领域中财务、人力、销售、生产、供应链等管理软件核心模块上的商业进展。

2)多模态:端到端分析规划能力提升,实现能看、能听、会思考的随身助手。多模态推理提升数理领域和规划分析效能,期待未来各场景中出现能看、能听、会思考的随身助手,编辑工具、教育、医疗、科研等领域的产品形态有望率先迎来新变化,C端产品蕴含爆款机会。

3)算力:Scaling Law范式切换,Agent带动推理算力需求。我们认为逻辑推理性能发展会带动算力产业,将从单纯预训练的Pre-training Scalling-law,走向后训练和推理的Post Training/Test-time Scaling-law。MoE带动架构向专家并行发展,推理集群的形式未来有望成为主流推理方式,计算节点通过提升计算密度满足推理需求。我们认为大规模的Scale up超节点与超大规模Scale out集群仍将并行发展,系统级算力解决方案提供能力将更加重要。随着Agent能力提升,渗透率、用户每日调用次数、任务复杂度将望实现三重提升,其算力需求增幅和增速都将超越以往的大模型。

▍风险因素:

AI核心技术发展不及预期风险,企业数据安全风险,信息安全风险,行业竞争加剧风险,地缘政治风险,劳动力市场风险,虚假信息风险。

▍投资策略:

下一代模型将实现技术、能力、生态的全面发展,模型有望以2-3倍规模实现10倍智能水平,推理性价比提升一倍提高应用盈利潜力。同时基于规模扩增和算法优化,逻辑推理、原生多模态、记忆系统等关键能力突破,加速高价值复杂行业场景应用落地。复杂任务解决能力提升,叠加推理性价比改善,将成为新一代AI应用发展基石,Agent和多模态两大主线有望持续引领产业,并同步带动推理端算力需求。建议关注企业管理、教育、医疗、科研等领域的头部公司,同步关注算力产业新机会,综合梳理三条投资主线:

1)通用Agent应用:Agent流程更复杂、高效个性化,企业级Agent价值提升;

2)垂直Agent应用:多模态打开全新应用场景,关注教育、医疗、科研等领域的头部公司;

3)算力产业链:我们认为算法演进推动集群超大EP进化,scale up + scale out将并行优化。

本文节选自中信证券研究部已于2025年7月31日发布的《计算机行业智能领军(AI SOTA)系列报告1—下一代大模型(GPT-5):研究框架》报告,具体分析内容(包括相关风险提示等)请详见报告。

本文源自券商研报精选

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap