首页 排行榜文章正文

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

排行榜 2025年10月04日 19:51 0 aa

2025年这年,国产GPU算是真醒过来了,之前提起GPU,不管是玩游戏还是搞AI训练,大家脑子里基本就一个英伟达。现在不一样了,摩尔线程、沐曦股份、壁仞科技、燧原科技这“四小龙”,今年都陆续启动上市进程了。华为更猛,直接亮出底牌,说昇腾系列GPU的规划都做到2028年了,性能还一路往上提,连黄仁勋都出来说美国AI芯片就比中国领先几纳秒。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

说实话,我之前对国产GPU没抱特别大期待,总觉得跟英伟达比还差得远,但今年看下来,不管是咱们普通用户用的消费级产品,还是企业用的数据中心级产品,国产厂商还真拿出了能跟英伟达对标的东西。

消费级能玩3A,数据中心靠“狼群”打配合

先说说消费级的,咱们平时玩游戏、做设计都靠这个,摩尔线程出的MTTS90,还有砺算科技的7G106,测下来性能居然比英伟达RTX4060还高。我身边有个朋友专门试了用MTTS90跑《黑神话:悟空》,开高画质居然能流畅运行,这要是放在前两年,想都不敢想。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

芯动科技的风华三号更全面,带了112GHBM内存,能搞8K渲染还支持硬件光锥,跟英伟达RTX40系列比也不落下风。更厉害的是,它单张卡就能运行72B参数的大模型,8张卡连起来还能驱动DeepSeek的满血版。本来想觉得国产GPU也就只能应付日常用,后来发现技术上确实在往英伟达的终端产品靠,速度比我预想的快多了。

数据中心级的也不差,华为的昇腾910C,在FP16精度这个标准下,算力能做到800TFLOPS,还带128GHBM内存,性能能到英伟达H100的八成。单张卡比不过没关系,华为玩起了“狼群战术”,英伟达最大的NVL72模块能装72张GPU和36个CPU,华为的昇腾384超节点直接装384张GPU和192个CPU,用数量补了单卡的差距。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

现在国内各大算力中心里,华为、摩尔线程、沐曦这些厂商都在往里渗透,AI大模型训练和推理这些场景,国产GPU的出货量已经不少了。之前去参观过一个算力中心,工作人员说现在不少训练任务都开始用国产卡了,不是非要依赖英伟达不可。

虽说国产GPU现在拿出了能对标英伟达的产品,但老实讲,真要马上追上还没那么容易,人家手里握着几道不好跨的坎。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

想追平英伟达?这三道坎得慢慢迈

第一道坎就是生态体系,英伟达的CUDA平台搞了20年,配套的库和工具得有好几万种,还跟TensorFlow、PyTorch这些主流AI框架绑得特别紧。开发者用了这么多年,早就习惯了,上手快还稳定。

国产这边呢,华为有自己的CNN框架,但主流软件的成熟度和易用性还差点儿意思,得接着优化。其他厂商大多选了“兼容CUDA”的路子,可这不是直接用人家的代码,那样会侵权,只是在API接口和编译器层面兼容,让开发者不用学新规则。但函数内部怎么运行,还得自己写代码。生态这东西特别怪,得大规模部署才能攒经验,可没经验又没人敢大规模用,这循环绕不开。我问过一个做AI开发的朋友,他说现在写代码还是优先考虑CUDA,不是不想用国产的,主要是怕踩坑,效率低。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

第二道坎是工艺节点,英伟达现在都用4纳米工艺了,晶体管密度差不多是国产GPU的两倍。晶体管密度越高,功耗越低、性能越强,这直接影响GPU的算力上限。

现在国产GPU主要还在用7纳米工艺,想跟上就得往5纳米、3纳米走,虽说5纳米技术咱们有了,但产线优先给手机、电脑的SoC用,GPU根本排不上号。这么算下来,工艺上至少落后一到两代。好在现在高端GPU能搞多die封装,比如英伟达B200就是两个die拼的,国产厂商也学着用2个、4个甚至8个die封装,多少能抵消点工艺落后的劣势。但这毕竟是“曲线救国”,不是从根本上解决问题。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

第三道坎是供应链,英伟达能在全球挑最好的供应商,HBM内存都用到HBM3E了,HBM4都开始送样测试了。国产GPU受半导体管制影响,主要还得靠HBM2、HBM2E,就算HBM3、HBM3E在推进,也至少差一代。HBM内存的速度直接影响大模型训练效率,这步跟不上,整体性能就容易被拉开。

长鑫存储今年8月说HBM2量产了,每月能产1万片左右,但这点量也就够国内20%的GPU用,HBM3还在测试阶段,预计明年才能量产,可英伟达HBM4明年就要正式商用了,差距短期真不好补。不过也不用太悲观,国产GPU不是没机会,咱们有自己的优势能慢慢追。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

中国是全球最大的AI市场,今年AI算力需求占了全球三成多,这么大的市场,给国产GPU提供了“试错-优化”的空间。我知道有个头部互联网企业,用华为昇腾GPU完成了70B大模型训练,成本比用英伟达H100低了不少。有这么多实际场景练手,国产GPU的生态和性能都能慢慢优化。

政策和资金也给力,“东数西算”工程明确要求算力中心用国产GPU的比例不能低于三成,今年国家大基金三期给国产GPU领域投了超500亿元,专门支持摩尔线程、沐曦这些企业搞研发、扩产能。华为今年研发投入里,昇腾GPU相关的就占了15%,超180亿元,重点攻生态工具和先进封装技术;寒武纪还拿了地方政府20亿元专项补贴,用来搞5纳米GPU芯片研发。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

至于什么时候能追平,行业里大多觉得十年内大致看齐英伟达问题不大,2030年的时候,国产GPU单卡性能能到英伟达同期产品的九成,生态成熟度超八成,供应链自主化率达七成,这个目标不算离谱。

中国电子技术标准化研究院有个专家说的挺对,国产GPU不用非要“全面复刻英伟达”,可以走“场景定制化”的路子。比如在智能驾驶、工业AI这些垂直领域,国产GPU已经有成本和适配优势了,说不定能靠这个缩短差距。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

总的来说,2025年确实是国产GPU的“觉醒年”,消费级和数据中心级都有了能对标英伟达的产品,有些场景甚至能直接替代。但要全面追平,生态、工艺、供应链这三道坎还得慢慢跨。不过凭着国内庞大的市场和持续的投入,十年内大致看齐英伟达不是不可能。现在咱们已经摆脱了“没英伟达不行”的困境,接下来就是给点时间,把每一步的差距慢慢缩小。

国产GPU的“追平路径”:市场、政策与技术迭代的三重助力

说实话,黄仁勋说“只差几纳秒”,更像是种恭维,英伟达肯定不会停下脚步,咱们现在能做到“可用”,下一步就是往“好用”走,把“追平”从期待变成真事儿。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap