记者 董温淑编辑 高宇雷7月25日,2025世界人工智能大会(WAIC 2025)开幕前夕,大模型企业阶跃星辰在上海正式发布其新一代基础大模型——St...
2025-07-26 0
记者 董温淑
编辑 高宇雷
7月25日,2025世界人工智能大会(WAIC 2025)开幕前夕,大模型企业阶跃星辰在上海正式发布其新一代基础大模型——Step 3。
官方信息显示,作为阶跃的主力基座模型,Step 3兼顾智能与效率,旨在面向推理时代打造最适合应用的模型。
Step 3将于7月31日面向全球企业和开发者开源,为开源世界贡献最强多模态推理模型。同时,阶跃星辰还宣布联合多家国内领先的芯片、平台厂商发起成立“模芯生态创新联盟”,将通过推动模型和芯片产业链联合创新,加速大模型应用的落地。
此外,阶跃星辰与上海国有资本投资有限公司达成深度战略合作,将围绕加强资本链接、生态业务合作等方面进行全面的深度合作。
阶跃星辰创始人、CEO姜大昕称,经过此前对Step 1、Step 2两代基模的快速迭代,阶跃星辰意识到:“我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代Step 3基础模型的出发点。”
Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试与Scale Up。Step 3采用 MoE 架构,总参数量 321B,激活参数量 38B。
性能方面,Step 3提升了视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。
在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上,Step 3取得了开源多模态推理模型的SOTA成绩。
而成本方面,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于 NVIDIA Hopper 架构的芯片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。并且,这是在不牺牲激活参数量、不降低注意力容量的条件下实现的。
目前,Step 3已授权国内多家芯片公司,其中华为昇腾芯片已首先实现Step 3的搭载和运行;沐曦、天数智芯和燧原科技等也已初步实现运行Step 3,另有其他厂商适配工作正在开展。
同时,Step 3将于7月31日正式面向全球企业和开发者开源。
在发布环节之后,阶跃星辰还宣布将联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,以打通芯片、模型和平台全链路技术。该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。
相关文章
记者 董温淑编辑 高宇雷7月25日,2025世界人工智能大会(WAIC 2025)开幕前夕,大模型企业阶跃星辰在上海正式发布其新一代基础大模型——St...
2025-07-26 0
大众网记者 黄新宇 滨州报道为丰富辖区青少年暑期生活,拓宽科学视野,培养探索精神,7月23日,阳信县信城街道开展“探索科技奥秘 点燃科学梦想”青少年科...
2025-07-26 0
7月23日,交口县经济技术开发区科学技术协会(以下简称“交口经开区科协”)成立大会在经开区管委会隆重举行。该协会的成立标志着我市园区科协组织建设取得新...
2025-07-26 0
2025年CCF-华为胡杨林基金理论计算机与计算经济学专项共发布6项课题和开放课题,单项资助金额15万/25万,课题即将于2025年8月1日 24:0...
2025-07-26 0
金融界2025年7月26日消息,国家知识产权局信息显示,世维通河北科技有限公司取得一项名为“快速准确偏振对准装置及方法”的专利,授权公告号CN1112...
2025-07-26 0
金融界2025年7月26日消息,国家知识产权局信息显示,陕西省交通规划设计研究院有限公司取得一项名为“基于偏折角度自适应应对不同弯道的公路护栏”的专利...
2025-07-26 0
昨天,在博鳌亚洲论坛全球健康论坛2025年北京会议“加强全球卫生治理 共同促进全民健康覆盖”分论坛上,北京市卫健委一级巡视员郑晋普表示,北京市通过援外...
2025-07-26 0
文 | 果冉多编辑 | 果冉多声明:本文内容均引用权威资料结合个人观点进行撰写,文末已标注文献来源及截图,请知悉。中国现在的铁路发展是有目共睹的,但是...
2025-07-26 0
发表评论