谷歌不交“英伟达税”?揭秘其新一代TPU芯片

目前,所有顶尖的AI实验室都在 rationing(配给)两种资源:电力和算力。大多数实验室的模型训练算力都来自同一家供应商,其高昂的毛利率让英伟达(Nvidia)成为全球市值最高的公司之一。谷歌则另辟蹊径。

周二晚,谷歌在拉斯维加斯F1广场的一场私人活动中,预览了其第八代张量处理单元(TPU)。其核心是两款将于今年推出的定制芯片,专为现代AI工作负载的不同部分而设计。TPU v8t用于前沿模型的训练,TPU v8i则针对低延迟、高内存消耗的智能体推理和实时采样场景。

谷歌AI与基础设施高级副总裁兼首席技术官阿明·瓦赫达(Amin Vahdat)在台上强调,对企业买家来说,一个比任何具体规格都更重要的观点是:谷歌端到端地设计其AI堆栈的每一层,这种垂直整合的优势正体现在其“每token成本”的经济性上,谷歌表示其竞争对手无法比拟。

“一年一芯片已不够”:谷歌2024年双芯片路线图的背后

v8t和v8i背后更有趣的故事,是谷歌决定将路线图一分为二的时间点。据瓦赫达透露,这一决定是在2024年做出的——比整个行业普遍转向将推理模型、智能体和强化学习作为主流前沿工作负载早了一年。在当时,这是一个颇具前瞻性的判断。瓦赫达在炉边谈话中表示:“我们两年前就意识到,一年推出一款芯片已远远不够。这是我们首次尝试采用两款高性能的专用芯片。”

对于企业客户而言,这意味着具体的变化。过去,在谷歌云上进行微调或大规模训练的客户,以及在Vertex AI上部署生产级智能体的客户,都租用着相同的加速器,这带来了效率上的折损。v8是首个在芯片层面本身……

原文链接:https://venturebeat.com/orchestration/google-doesnt-pay-the-nvidia-tax-its-new-tpus-explain-why


关注微信号:智享开源 关注微博:IMCN开源资讯网 ,可及时获取信息

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章268篇


[blog_mailer_subscribe]

关注微信

分类