华为高管语出惊人：华为AI计算效率三倍于英伟达，实现范式跨越

景点排名 2025年10月05日 00:45 0 aa

华为高管的AI计算效率宣言：从工艺神话到结果导向

华为云CEO张平安在全联接大会上的发言，直击AI芯片领域的核心争议：昇腾系列的计算效率已实现生产结果的三倍于Nvidia H20。这一表态并非空谈，而是基于昇腾云服务的实际部署——零重大事故756天的可靠性记录，支撑Pangu（盘古）模型与第三方如DeepSeek的混合训练。张平安强调，客户需求已从纳米级工艺转向高质输出：“5nm或7nm并非决定因素，真正重要的是计算结果的品质。”这一观点，源于华为在美方管制下的战略调整：从硬件囤积转向软件优化，昇腾910C的单卡生成速度达2400 tokens/秒，延迟仅50ms，适用于从文本生成到边缘推理的全场景。

这一宣言的背景，是我国AI生态的务实纠偏。“东数西算”工程虽上线超500个项目，总功率数百吉瓦，却因芯片短缺导致80%产能闲置。张平安的3倍效率指标，呼应了DeepSeek团队的独立测试：昇腾910C在推理任务中，性能达Nvidia H100的60%，远超H20的降级基准。这一数据，非实验室孤例，而是企业级应用的镜像——字节跳动等客户已下单超10万颗910C，交付率达70%，凸显本土算力的渐进成熟。

华为AI计算效率三倍于英伟达

昇腾910C工程剖析：集群互联与HBM优化的韧性设计

昇腾910C的工程内核，体现了华为对效率的精密把控：采用中芯国际N+2工艺的24核AI处理器，支持FP8稀疏计算峰值600 TFLOPS，适用于万亿参数模型的本地训练。相比Nvidia H20的2TB/s带宽限制，910C嵌入三星HBM3E的12层堆栈，提供4.8TB/s传输速率，功耗降30%。这一设计源于凌渠互联协议的光互连技术：取代传统铜缆，延迟压缩至纳秒级，热管理通过液冷与玻璃基板封装，确保99.99%可用性。Atlas 950 SuperPod集群便是典型，可串联8192张卡，提供16 EFLOPS浮点运算，专为智能制造与智慧城市部署。

细节中见韧性：CANN工具的开源路径，已拉动开发者迁移率30%，兼容DeepSeek R1的蒸馏技术，训练成本压缩5倍。在V2X优化场景中，昇腾的推理吞吐增20%，响应我国从训练内卷向应用落地的转向。工程上，这一效率三倍并非绝对峰值，而是生产结果的综合——DeepSeek测试显示，910C在角色扮演与加密挑战下的鲁棒性，超阿里Qwen 15%，得益于软件层面的动态频谱分配。相比H20的CUDA生态迁移壁垒，昇腾的端到端优化，更适配本土企业的混合负载。

Nvidia份额滑落：本土AI芯片市场的渐进洗牌

张平安的宣称，折射出全球AI芯片格局的分化。TrendForce数据显示，2025年我国本土GPU营收达500亿美元，年增150%，华为市占超40%，填补Nvidia营收从低双位数滑落至不足5%的真空。H20的“倾销”虽缓解短期饥渴，却因性能阉割——带宽仅H100的60%——让企业转向昇腾的势头加速：昇腾920作为H20替代，内存带宽达4TB/s，训练效率提升30-40%。这一趋势根植于政策导向：“AI+”倡议转向推理部署，芜湖中心为东部城市提供低延迟服务，数据吞吐增20%。

全球视野中，这一镜像科技碎片化：Nvidia Blackwell的3TB/s全栈虽领先，但美方BIS规则扩展实体清单，放大供应链风险。Forrester报告指出，昇腾虽工具集成不足，却赋能千行百业，数字经济指数跃升。张平安的语境，还解构了工艺神话：7nm良率虽70%，但昇腾在边缘AI中的蚕食份额已达25%。隐忧在于能源：Atlas 950日耗电相当于千户家庭，迫使转向CXL互连；机遇更显，2026年HBM本土份额或超50%，华为若统一生态，将重塑从实验室向产业的闭环。

结语：昇腾效率，华为AI路径的稳健一步

张平安对昇腾计算效率三倍于Nvidia H20的表态，以DeepSeek测试的60% H100性能为实证，在本土生态中稳固了华为的定位。它通过集群优化与应用导向，化解了算力闲置的痛点，推动AI从硬件依赖向结果交付的渐进调整。这一进展虽需持续基准验证，却为我国算力市场注入可靠动能，奠定长远竞争的务实基础。