11月6日消息,谷歌正将其迄今为止最强大的芯片广泛推向市场,这是该巨头为赢得人工智能公司业务而提供定制芯片的最新举措。该公司周四表示,其第七代张量处理...
2025-11-07 2
11月6日消息,谷歌正将其迄今为止最强大的芯片广泛推向市场,这是该巨头为赢得人工智能公司业务而提供定制芯片的最新举措。
该公司周四表示,其第七代张量处理单元 (TPU) Ironwood 将在未来几周内上市供公众使用,此前该产品已于 4 月份首次推出进行测试和部署。
这款自主研发的芯片旨在处理从大型模型训练到驱动实时聊天机器人和人工智能代理等各种任务。谷歌表示,通过将多达 9216 个芯片集成到单个芯片组中,新型 Ironwood TPU 消除了“最苛刻模型的数据瓶颈”,并使客户“能够运行和扩展现有规模最大、数据密集型的模型”。
谷歌正与竞争对手微软展开一场胜负难料的竞争。,亚马逊和Meta为了构建未来的人工智能基础设施。虽然大多数大型语言模型和人工智能工作负载都依赖于英伟达的……图形处理单元 (GPU),例如谷歌的 TPU,属于定制芯片的范畴,在价格、性能和效率方面具有优势。
TPU(线程处理单元)的研发历时十年。据谷歌称,Ironwood 的速度比其前代产品快四倍以上,而且已经有不少大型客户预订。谷歌表示,人工智能初创公司 Anthropic 计划使用多达 100 万个新型 TPU 来运行其 Claude 模型。
除了这款新芯片,谷歌还推出了一系列升级,旨在使其云服务更便宜、更快、更灵活,以与规模更大的云服务提供商亚马逊网络服务 (AWS) 和微软 Azure 展开竞争。
谷歌在上周发布的财报中显示, 第三季度云计算收入达151.5亿美元,同比增长34%。其中,Azure收入增长40%,亚马逊AWS收入增长20%。谷歌表示,2025年前九个月签署的十亿美元级云计算交易数量超过了过去两年的总和。
为了满足激增的需求,谷歌将今年的资本支出预测上限从 850 亿美元上调至 930 亿美元。
“我们看到市场对我们的人工智能基础设施产品,包括基于TPU和GPU的解决方案,有着巨大的需求,”首席执行官桑达尔·皮查伊在财报电话会议上表示。“这是我们过去一年增长的关键驱动力之一,我认为展望未来,我们将继续看到非常强劲的需求,我们也正在加大投资以满足这一需求。”
此举凸显了云服务提供商之间为掌控人工智能基础设施层而展开的日益激烈的竞争,与此同时,人们也越来越质疑该行业能否维持目前的资本支出速度。谷歌的做法——自主研发芯片而非仅仅依赖英伟达占据主导地位的GPU芯片——实际上是在押注从芯片设计到软件的垂直整合能够带来更优的经济效益和性能。
谷歌高管们将这些公告围绕着他们所谓的“推理时代”展开——这是一个过渡时期,企业将资源从训练前沿人工智能模型转移到将其部署到生产应用程序中,每天处理数百万或数十亿个请求。
谷歌云人工智能与基础设施副总裁兼总经理Amin Vahdat表示:“包括谷歌的Gemini、Veo和Imagen以及Anthropic的Claude在内的当今前沿模型,都在张量处理单元(Tensor Processing Unit)上进行训练和运行。对许多组织而言,重点正从训练这些模型,转向如何利用这些模型实现有用且响应迅速交互。”
这种转变对基础设施需求产生了深远的影响。训练工作负载通常可以容忍批量处理和较长的完成时间,但推理——即实际运行训练好的模型以生成相应的过程——则需要始终如一的低延迟、高吞吐量和绝对可靠性。无论底层模型的性能多么强大,一个需要 30 秒才能响应的聊天机器人或一个经常超时的编码助手都将变得无法使用。
智能体工作流程(即人工智能系统自主行动,而不是仅仅响应提示)带来了特别复杂的基础设施挑战,需要专用人工智能加速器和通用计算之间的紧密协作。
Ironwood不仅仅是对谷歌第六代 TPU 的渐进式改进。根据该公司公布的技术规格,与上一代产品相比,Ironwood 在训练和推理工作负载方面的性能提升超过四倍——谷歌将这一提升归功于系统级协同设计方法,而不仅仅是增加晶体管数量。
该架构最引人注目的特点是其规模。单个 Ironwood“模块”(由紧密集成的 TPU 芯片组成,作为一个超级计算机运行)可以通过谷歌专有的芯片间互连网络连接多达 9216 个独立芯片,传输速度高达每秒 9.6 太比特。为了更直观地理解这个带宽,它大致相当于在不到两秒的时间内下载整个美国国会图书馆。
这种庞大的互连架构使9216颗芯片能够共享1.77PB的高带宽内存——其速度足以跟上芯片的处理速度。这相当于约4万部高清蓝光电影的工作内存,可供数千个处理器同时即时访问。谷歌在技术文档中指出:“作为参考,这意味着Ironwood Pods的FP8 ExaFLOPS性能是其最接近的竞争对手的118倍。”
该系统采用光路交换技术,构成一个“动态可重构架构”。当个别组件发生故障或需要维护时(在这种规模下,这种情况不可避免),OCS 技术会在几毫秒内自动将数据流量绕过中断点,从而使工作负载能够继续运行,而不会对用户造成任何可见的干扰。
这种对可靠性的重视体现了从前五代TPU部署中汲取的经验教训。谷歌报告称,自2020年以来,其液冷系统的整体正常运行时间一直保持在约99.999%的可用性水平——相当于每年停机时间不到6分钟。
对 Ironwood 能力的最重要外部验证或许来自Anthropic 承诺提供多达一百万个 TPU 芯片——在这个行业中,即使是 10,000 到 50,000 个加速器的集群也被认为是庞大的,这是一个惊人的数字。
Anthropic首席财务官Krishna Rao在正式合作协议中表示:“Anthropic和谷歌有着长期的合作伙伴关系,此次扩容将帮助我们继续提升计算能力,从而引领人工智能的前沿发展。我们的客户——从《财富》500强企业到人工智能初创公司——都依赖Claude来开展最重要的工作,而此次扩容确保我们能够满足呈指数级增长的需求。”
根据另一份声明,Anthropic公司将在2026年获得“超过1吉瓦的并网发电容量”——足以满足一座小型城市的用电需求。该公司特别指出,TPU的“性价比和效率”是其作出这一决定的关键因素,此外还有“利用TPU训练和维护其模型的现有经验”。
行业分析师估计,获得一百万个 TPU 芯片以及相关的基础设施、网络、电力和冷却的承诺,可能代表着一份价值数百亿美元的多年期合同——这是历史上已知的最大的云基础设施承诺之一。
Anthropic 的计算主管 James Bradbury 详细阐述了推理方面的重点:“Ironwood 在推理性能和训练可扩展性方面的改进将帮助我们高效扩展,同时保持客户期望的速度和可靠性。”
除了Ironwood之外,谷歌还为其Axion 处理器系列推出了更多选项——定制的基于 Arm 的 CPU,专为支持 AI 应用但不需要专用加速器的通用工作负载而设计。
谷歌推出的N4A 实例类型目前处于预览阶段,其目标用户群体被谷歌描述为“微服务、容器化应用、开源数据库、批处理、数据分析、开发环境、实验、数据准备和 Web 服务作业,这些作业使人工智能应用成为可能”。该公司声称,N4A 的性价比比同类当前 x86 架构的虚拟机高出两倍。
谷歌还在预览其首个裸机 Arm 实例C4A metal ,该实例为 Android 开发、汽车系统和具有严格许可要求的软件等特殊工作负载提供专用物理服务器。
Axion战略体现了一种日益增强的信念,即未来的计算基础设施既需要专用AI加速器,也需要高效的通用处理器。TPU负责运行AI模型这一计算密集型任务,而Axion级处理器则负责管理数据摄取、预处理、应用逻辑、API服务以及现代AI应用堆栈中的无数其他任务。
早期客户反馈表明,这种方法能够带来可衡量的经济效益。Vimeo 在初步的 N4A 测试中报告称,与同类 x86 虚拟机相比,其核心转码工作负载的性能提升了 30%。ZoomInfo 的首席基础设施架构师 Sergei Koren 表示,该公司在 Java 服务上运行的数据处理管道的性价比提升了 60%。
如果开发者无法轻松利用硬件性能,那么就毫无意义。谷歌强调,Ironwood和Axion都集成到了其所谓的AI 超级计算机中——“这是一个集成了计算、网络、存储和软件的超级计算系统,旨在提高系统级性能和效率。”
根据 IDC 2025 年 10 月发布的《商业价值快照》研究,人工智能超级计算机客户平均实现了 353% 的三年投资回报率、降低了 28% 的 IT 成本,并提高了 55% 的 IT 团队效率。
谷歌公布了多项旨在最大限度提高 Ironwood 利用率的软件增强功能。谷歌 Kubernetes Engine现在为 TPU 集群提供高级维护和拓扑感知功能,从而实现智能调度和高弹性部署。该公司开源的 MaxText 框架现在支持包括监督式微调和生成式强化策略优化在内的高级训练技术。
对于生产环境部署而言,谷歌推理网关最重要的优势或许在于它能够智能地在模型服务器之间进行请求负载均衡,从而优化关键指标。据谷歌称,通过前缀缓存感知路由等技术,它可以将首次令牌延迟降低 96%,并将服务成本降低高达 30%。
推理网关会监控关键指标,包括键值缓存命中率、GPU 或 TPU 利用率以及请求队列长度,然后将传入的请求路由到最佳副本。对于多个请求可能共享上下文的对话式 AI 应用,将具有共享前缀的请求路由到同一服务器实例可以显著减少冗余计算。
这些公告背后隐藏着巨大的物理基础设施挑战,谷歌在最近的开放计算项目欧洲、中东和非洲峰会上对此进行了阐述。该公司透露,他们正在部署±400伏直流供电系统,每个机架最高可支持1兆瓦的功率——比典型部署方案高出十倍。
谷歌首席工程师马杜苏丹·艾扬格和安珀·霍夫曼在2025年4月的一篇博客文章中解释说:“人工智能时代需要更强大的电力供应能力。到2030年之前,机器学习每个IT机架将需要超过500千瓦的电力。”
谷歌正与 Meta 和微软合作,制定高压直流配电的电气和机械接口标准。该公司特意选择400 伏直流电,旨在利用电动汽车建立的供应链,“实现更大的规模经济效益、更高效的生产制造以及更高的质量和规模”。
在冷却方面,谷歌透露将向开放计算项目(Open Compute Project)贡献其第五代冷却分配单元设计。该公司在过去七年中已在超过2000个TPU Pod上部署了“千兆瓦级”液冷系统,整体可用性约为99.999%。
对于给定的温度变化,水单位体积的热量输送能力大约是空气的 4000 倍——这一点至关重要,因为单个 AI 加速芯片的功耗越来越高,达到 1000 瓦甚至更高。
谷歌的这些声明正值人工智能基础设施市场迎来转折点之际。尽管英伟达在人工智能加速器领域保持着绝对优势——市场份额估计高达 80% 至 95%——但云服务提供商正加大对定制芯片的投资,以实现产品差异化并提升单位经济效益。
亚马逊网络服务率先采用了这种方法,推出了基于Arm架构的Graviton CPU和Inferentia / Trainium人工智能芯片。微软开发了Cobalt处理器,据报道正在研发人工智能加速器。谷歌目前在主要云服务提供商中拥有最全面的定制芯片产品组合。
该策略面临着固有的挑战。定制芯片的开发需要巨额的前期投资——通常高达数十亿美元。专用加速器的软件生态系统落后于英伟达的CUDA平台,后者受益于15年以上的开发者工具积累。此外,人工智能模型架构的快速演进也带来了风险,即针对当前模型优化的定制芯片可能会随着新技术的出现而逐渐失去其适用性。
然而,谷歌辩称其方法具有独特的优势。“十年前,我们就是这样构建了第一个TPU,而TPU又促成了八年前Transformer架构的诞生——正是这种架构驱动着大多数现代人工智能,”该公司指出,并提及了谷歌研究人员于2017年发表的开创性论文《注意力机制就是你所需要的一切》。
其论点是,紧密集成——“模型研究、软件和硬件开发在同一屋檐下”——能够实现使用现成组件无法实现的优化。
除了 Anthropic 之外,其他几家客户也提供了早期反馈。开发创意人工智能工具的 Lightricks 公司研究总监 Yoav HaCohen 表示,Ironwood 的早期测试“让我们对为全球数百万客户创造更细致、更精确、更高保真度的图像和视频生成效果充满热情”。
谷歌的公告引发了一些问题,这些问题将在未来几个季度得到解答。在各大人工智能公司集体投入数千亿美元的情况下,该行业能否维持目前的基建投入?定制芯片在经济效益上是否会优于英伟达的GPU?模型架构又将如何演变?
目前看来,谷歌似乎仍然坚持几十年来定义该公司的战略:构建定制基础设施以实现通用硬件上无法实现的应用程序,然后将该基础设施提供给希望拥有类似功能但又不想进行资本投资的客户。
随着人工智能行业从研究实验室过渡到服务数十亿用户的生产部署,基础设施层——使这一切运行的硅、软件、网络、电力和冷却——可能与模型本身一样重要。
如果 Anthropic 愿意承诺提供多达一百万个芯片可以作为参考的话,那么谷歌押注专为推理时代设计的定制芯片可能正在获得回报,而此时需求也正达到拐点。
相关文章
11月6日消息,谷歌正将其迄今为止最强大的芯片广泛推向市场,这是该巨头为赢得人工智能公司业务而提供定制芯片的最新举措。该公司周四表示,其第七代张量处理...
2025-11-07 2
文 | 听筒Tech即便是中国市场增长日渐乏力,但苹果还是在双十一这个关键节点祭出了一记重拳。11月6日,《听筒Tech》从一位经销商提供的独家文件中...
2025-11-07 2
文 | 平安顺编辑 | 平安顺当全球芯片产业还在为欧美的光刻机禁令焦头烂额时,另一战场早已硝烟弥漫。10年前,中国在该领域80%依赖进口,被外媒嘲讽“...
2025-11-07 3
IT之家 11 月 7 日消息,科技媒体 9to5Mac 今天(11 月 7 日)发布博文,汇总梳理了 iOS 26.2 和 iPadOS 26.2...
2025-11-07 3
跨境电商是迅速发展的外贸新业态、新模式,已成为我国外贸发展的有生力量。2025年中国(广州)跨境电商交易会将于8月15—17日在广交会展馆举办。记者从...
2025-11-07 7
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-11-07 13
今天给各位分享麻将是不是有挂的知识,其中也会对麻将是不是有挂牌的进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!微乐麻将小程序有...
2025-11-07 3
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-11-07 13
发表评论