谷歌不交“英伟达税”?揭秘其新一代TPU芯片
目前,所有顶尖的AI实验室都在 rationing(配给)两种资源:电力和算力。大多数实验室的模型训练算力都来自同一家供应商,其高昂的毛利率让英伟达(Nvidia)成为全球市值最高的公司之一。谷歌则另辟蹊径。
周二晚,谷歌在拉斯维加斯F1广场的一场私人活动中,预览了其第八代张量处理单元(TPU)。其核心是两款将于今年推出的定制芯片,专为现代AI工作负载的不同部分而设计。TPU v8t用于前沿模型的训练,TPU v8i则针对低延迟、高内存消耗的智能体推理和实时采样场景。
谷歌AI与基础设施高级副总裁兼首席技术官阿明·瓦赫达(Amin Vahdat)在台上强调,对企业买家来说,一个比任何具体规格都更重要的观点是:谷歌端到端地设计其AI堆栈的每一层,这种垂直整合的优势正体现在其“每token成本”的经济性上,谷歌表示其竞争对手无法比拟。
“一年一芯片已不够”:谷歌2024年双芯片路线图的背后
v8t和v8i背后更有趣的故事,是谷歌决定将路线图一分为二的时间点。据瓦赫达透露,这一决定是在2024年做出的——比整个行业普遍转向将推理模型、智能体和强化学习作为主流前沿工作负载早了一年。在当时,这是一个颇具前瞻性的判断。瓦赫达在炉边谈话中表示:“我们两年前就意识到,一年推出一款芯片已远远不够。这是我们首次尝试采用两款高性能的专用芯片。”
对于企业客户而言,这意味着具体的变化。过去,在谷歌云上进行微调或大规模训练的客户,以及在Vertex AI上部署生产级智能体的客户,都租用着相同的加速器,这带来了效率上的折损。v8是首个在芯片层面本身……
原文链接:https://venturebeat.com/orchestration/google-doesnt-pay-the-nvidia-tax-its-new-tpus-explain-why
关注微信号:智享开源 关注微博:IMCN开源资讯网 ,可及时获取信息
评论列表
发表评论
为你推荐

[blog_mailer_subscribe]
关注微信
近期评论
- 发表在《今天我终于找到了加快网站速度的办法》
- 发表在《如何成为超级个体?》
- 发表在《像ChatGPT一样记笔记》
- 发表在《python 如何将电子表格按照某一列相同数据分到一个一个工作表中》
- 发表在《python 如何将电子表格按照某一列相同数据分到一个一个工作表中》

还没有任何评论,你来说两句吧!