首页 抖音热门文章正文

谷歌最强AI芯片来了!

抖音热门 2025年11月09日 11:38 0 aa
谷歌最强AI芯片来了!

谷歌官宣第七代TPU Ironwood将在未来几周内正式推出。该芯片专为最严苛的工作负载而打造:从大规模模型训练、复杂的增强学习,到高容量、低延迟的 AI 推论和模型服务。 与TPU v5p相比,它的峰值效能提升了10倍;与TPU v6e(Trillium)相比,每颗芯片在训练与推论工作负载上的效能提升超过4倍,使Ironwood成为迄今最强大、最节能的定制化芯片。

谷歌最强AI芯片来了!

现今的先进模型都在Tensor Processing Unit(TPU)上进行训练和提供服务。对许多企业而言,其重心正从训练模型,转移到如何促成与模型之间有着实用且灵敏的互动。模型架构的不断演进、代理式工作流程的兴起,加上对运算需求近乎指数型的增长,共同定义了这个全新的AI推论时代。特别是那些需要通用运算和机器学习加速之间高度协作与调度的代理式工作流程,正为定制化芯片和垂直协同优化的系统架构创造新的机会。

因此,除了 Ironwood,此次谷歌还扩展了Axion产品组合,推出了全新ARM架构Axion执行个体N4A,以及首款 ARM架构裸机执行个体C4A metal。换言之,目前Axion产品组合现已包含三种强大的选项:N4A、C4A 和 C4A metal。其中N4A是迄今最具成本效益的 N 系列虚拟机器,现已推出预览版。而C4A metal即将推出预览版。

谷歌最强AI芯片来了!

TPU还是 AI Hypercomputer 的关键组件,AI Hypercomputer 是一体化超级计算系统,汇集了运算、网络、存储和软件,以提高系统级的性能和效率。 根据IDC最近的一份报告,导入AI Hypercomputer的客户平均达成了353%的三年投资回报率、降低28%的IT成本,并使IT团队效率提升55%。

谷歌最强AI芯片来了!

Ironwood superpod在单一域中直接连接 9,216 个 Ironwood TPU


Ironwood TPU将帮助客户进一步突破规模和效率的极限。部署TPU时,系统会将每个独立的芯片相互连结,形成一个Pod,使这些互连的TPU能作为单一运作的运算单元。通过Ironwood,可以在单一个superpod中扩展至9,216个芯片,并通过突破性的ICI网络达到9.6 TB/s的传输速度。这种大规模的连接性使数千个芯片能够快速相互通讯,并访问高达 1.77 PB 的共享高带宽内存(HBM),即便是对性能要求最高的模型数据瓶颈也能克服。

在如此大规模下,服务需要持续稳定的可用性,而OCS技术能作为一个动态、可重组的结构,能够即时绕过中断,恢复工作负载,同时让服务保持运行。当需要更多性能时,Ironwood可以在Pod间扩展,形成数十万个TPU的丛集。

值得一提的是,Anthropic对Ironwood的兴趣颇浓,谷歌透露,Anthropic计划使用多达100万个 TPU。Anthropic 运算主管 James Bradbury表示,“我们的客户,从《财富》世界五百强企业到初创公司,都仰赖Claude来处理他们最重要的工作。 随着需求持续指数型增长,我们在推动 AI 研究和产品开发的边界扩展时,也在增加我们的计算资源。 Ironwood 在推论效能和训练可扩展性上的提升,将帮助我们高效扩展,同时满足客户期望的速度和可靠性。”

想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap