谷歌TPU芯片问世十年后 精准定位到人工智能需求的黄金地带

发布时间:2025-10-24 10:00

10月24日,据外媒报道,在几乎完全由英伟达公司主导的人工智能芯片行业,谷歌十多年前专为人工智能任务开发的芯片终于在母公司之外崭露头角,成为训练和运行复杂人工智能模型的解决方案。

当地时间周四,Anthropic PBC宣布与谷歌母公司Alphabet达成协议,将为这家人工智能初创企业提供超过10亿瓦的额外计算能力,价值达数百亿美元。该协议使Anthropic能够使用多达100万个谷歌张量处理单元(TPU),并扩大了其对这家互联网巨头云服务的应用。

随着人工智能行业竞争者们争相应对激增的需求,他们一直在寻找不依赖英伟达加速器芯片的计算能力提升方案。这既是为了降低对这家芯片巨头昂贵产品的依赖,也是为了缓解芯片短缺的影响。尽管Anthropic已是TPU客户,但此次大幅扩容堪称对谷歌技术的最强力背书,也标志着其长期落后于亚马逊和微软的云业务取得重要突破。

TPU需求的激增将吸引更多AI初创企业和新客户关注谷歌云平台,助力该公司兑现多年芯片投资的回报。

Seaport分析师Jay Goldberg指出,谷歌与Anthropic的合作是“对TPU的有力验证”,可能促使更多企业尝试采用该技术。“许多人此前已考虑采用TPU,而现在考虑者数量可能大幅增加。”

图形处理器(GPU)是英伟达主导的芯片市场领域,最初用于加速图形渲染,主要应用于电子游戏及其他视觉特效领域,但后来发现其处理海量数据和计算的能力非常适合训练人工智能模型。而TPU则属于专用集成电路(ASIC)类产品,即为特定目的设计的微芯片。

谷歌于2013年启动首款TPU研发,两年后正式发布。初期应用于加速公司网络搜索引擎并提升效率。2018年谷歌首次将TPU引入云平台,客户可订阅基于该技术的计算服务。这项技术曾推动搜索引擎性能飞跃。

该芯片还被适配为谷歌自有应用中人工智能与机器学习任务的加速器。由于谷歌及其DeepMind部门开发了Gemini等尖端人工智能模型,公司得以将人工智能团队的经验反馈给芯片设计者,而芯片定制能力也反哺了人工智能团队。

谷歌云副总裁兼人工智能与计算基础设施总经理马克?洛梅尔在9月的会议演讲中表示:“十多年前我们构建首个基于TPU的系统时,主要目的是解决内部扩展难题。” “当我们将这种计算能力交付给谷歌DeepMind等团队的研究人员后,在诸多层面直接催生了Transformer模型的诞生。”他所指的正是谷歌开创性的AI架构,该架构已成为当今模型的基石。

英伟达芯片之所以成为人工智能市场的黄金标准,是因为该公司生产GPU的时间远超其他任何企业,其产品不仅性能强大、更新频繁、配套完整软件套件,还具备足够的通用性以应对各类任务。然而由于需求激增,其价格高昂且过去几年长期供不应求。

塞波特公司的戈德堡指出,TPU芯片因专为AI任务定制,往往能实现更优性能。这位分析师对英伟达股票罕见地给出“卖出”评级。他解释称,这种设计使谷歌能“剔除芯片中大量非AI优化的冗余部分”。谷歌现已推出第七代TPU产品,在提升芯片性能、增强运算能力的同时降低能耗,从而降低了运行成本。

当前TPU客户包括由OpenAI联合创始人伊利亚?苏茨克维尔去年创立的初创公司Safe Superintelligence,以及Salesforce、Midjourney和Anthropic等企业。

目前企业若想使用谷歌TPU,必须注册租用谷歌云计算资源。但彭博智库分析师指出,随着Anthropic合作协议的达成,谷歌向其他云平台扩展的可能性正显著提升。

当然,目前包括谷歌在内的任何企业都无意完全取代英伟达GPU。Gartner分析师高拉夫?古普塔指出,尽管谷歌拥有自主芯片,但其仍保持着英伟达最大客户之一的地位,因为其必须为客户提供灵活性。当客户的算法或模型发生变化时,GPU更能适应更广泛的工作负载需求。

Key Banc分析师贾斯汀?帕特森对此表示认同,称张量处理单元(TPU)的通用性不及GPU。但他向客户发布的报告指出,与Anthropic的合作既表明谷歌云市场份额正在提升,也凸显了TPU的“战略重要性”。

谷歌最新一代TPU“铁木”于四月发布,采用液冷设计,专为运行AI推理任务而打造,即应用AI模型而非训练模型。该产品提供256芯片集群与9216芯片超大规模集群两种配置。

谷歌TPU团队的资深成员如今正领导着芯片初创企业或在其他大型人工智能公司主导关键项目。推理芯片初创公司Groq由乔纳森?罗斯执掌,他曾参与TPU部分核心研发工作。这些前谷歌员工通过推动TPU成为AI领域主力军,持续扩大这家互联网巨头在人工智能行业的影响力。谷歌内部人士将多年积累的技术积淀视为产品成功的关键驱动力。

谷歌的Lohmeyer在9月表示:“如此深厚的技术积淀,实属无可替代。”