首页 景点排名文章正文

华为高管语出惊人:华为AI计算效率三倍于英伟达,实现范式跨越

景点排名 2025年10月05日 00:45 0 aa

华为高管的AI计算效率宣言:从工艺神话到结果导向

华为云CEO张平安在全联接大会上的发言,直击AI芯片领域的核心争议:昇腾系列的计算效率已实现生产结果的三倍于Nvidia H20。这一表态并非空谈,而是基于昇腾云服务的实际部署——零重大事故756天的可靠性记录,支撑Pangu(盘古)模型与第三方如DeepSeek的混合训练。张平安强调,客户需求已从纳米级工艺转向高质输出:“5nm或7nm并非决定因素,真正重要的是计算结果的品质。”这一观点,源于华为在美方管制下的战略调整:从硬件囤积转向软件优化,昇腾910C的单卡生成速度达2400 tokens/秒,延迟仅50ms,适用于从文本生成到边缘推理的全场景。

这一宣言的背景,是我国AI生态的务实纠偏。“东数西算”工程虽上线超500个项目,总功率数百吉瓦,却因芯片短缺导致80%产能闲置。张平安的3倍效率指标,呼应了DeepSeek团队的独立测试:昇腾910C在推理任务中,性能达Nvidia H100的60%,远超H20的降级基准。这一数据,非实验室孤例,而是企业级应用的镜像——字节跳动等客户已下单超10万颗910C,交付率达70%,凸显本土算力的渐进成熟。

华为高管语出惊人:华为AI计算效率三倍于英伟达,实现范式跨越

华为AI计算效率三倍于英伟达

昇腾910C工程剖析:集群互联与HBM优化的韧性设计

昇腾910C的工程内核,体现了华为对效率的精密把控:采用中芯国际N+2工艺的24核AI处理器,支持FP8稀疏计算峰值600 TFLOPS,适用于万亿参数模型的本地训练。相比Nvidia H20的2TB/s带宽限制,910C嵌入三星HBM3E的12层堆栈,提供4.8TB/s传输速率,功耗降30%。这一设计源于凌渠互联协议的光互连技术:取代传统铜缆,延迟压缩至纳秒级,热管理通过液冷与玻璃基板封装,确保99.99%可用性。Atlas 950 SuperPod集群便是典型,可串联8192张卡,提供16 EFLOPS浮点运算,专为智能制造与智慧城市部署。

细节中见韧性:CANN工具的开源路径,已拉动开发者迁移率30%,兼容DeepSeek R1的蒸馏技术,训练成本压缩5倍。在V2X优化场景中,昇腾的推理吞吐增20%,响应我国从训练内卷向应用落地的转向。工程上,这一效率三倍并非绝对峰值,而是生产结果的综合——DeepSeek测试显示,910C在角色扮演与加密挑战下的鲁棒性,超阿里Qwen 15%,得益于软件层面的动态频谱分配。相比H20的CUDA生态迁移壁垒,昇腾的端到端优化,更适配本土企业的混合负载。

Nvidia份额滑落:本土AI芯片市场的渐进洗牌

张平安的宣称,折射出全球AI芯片格局的分化。TrendForce数据显示,2025年我国本土GPU营收达500亿美元,年增150%,华为市占超40%,填补Nvidia营收从低双位数滑落至不足5%的真空。H20的“倾销”虽缓解短期饥渴,却因性能阉割——带宽仅H100的60%——让企业转向昇腾的势头加速:昇腾920作为H20替代,内存带宽达4TB/s,训练效率提升30-40%。这一趋势根植于政策导向:“AI+”倡议转向推理部署,芜湖中心为东部城市提供低延迟服务,数据吞吐增20%。

全球视野中,这一镜像科技碎片化:Nvidia Blackwell的3TB/s全栈虽领先,但美方BIS规则扩展实体清单,放大供应链风险。Forrester报告指出,昇腾虽工具集成不足,却赋能千行百业,数字经济指数跃升。张平安的语境,还解构了工艺神话:7nm良率虽70%,但昇腾在边缘AI中的蚕食份额已达25%。隐忧在于能源:Atlas 950日耗电相当于千户家庭,迫使转向CXL互连;机遇更显,2026年HBM本土份额或超50%,华为若统一生态,将重塑从实验室向产业的闭环。

结语:昇腾效率,华为AI路径的稳健一步

张平安对昇腾计算效率三倍于Nvidia H20的表态,以DeepSeek测试的60% H100性能为实证,在本土生态中稳固了华为的定位。它通过集群优化与应用导向,化解了算力闲置的痛点,推动AI从硬件依赖向结果交付的渐进调整。这一进展虽需持续基准验证,却为我国算力市场注入可靠动能,奠定长远竞争的务实基础。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap