InfoQ ·

谷歌发布Ironwood TPU，专为AI推理设计

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

谷歌在Cloud Next 25上发布了第七代Tensor处理单元（TPU）Ironwood，专为推理工作负载设计，支持9216个液冷芯片，具备强大计算能力，能够处理大型语言模型和复杂推理任务，推动主动AI模型的发展。

🎯

关键要点

谷歌在Cloud Next 25上发布了第七代Tensor处理单元（TPU）Ironwood，专为推理工作负载设计。
Ironwood是谷歌迄今为止性能最强、可扩展性最高的定制AI加速器，专门用于推理工作负载。
Ironwood支持9216个液冷芯片，连接使用Inter-Chip Interconnect（ICI）网络，是谷歌云AI超计算机架构的关键组成部分。
Ironwood能够处理大型语言模型（LLMs）、专家混合（MoEs）和高级推理任务，减少数据移动和延迟。
Ironwood提供256芯片和9216芯片配置，9216芯片的计算能力超过El Capitan超级计算机的24倍。
Ironwood每个芯片的峰值计算能力为4614 TFLOPS，具有增强的SparseCore加速器，适用于超大嵌入处理。
与前一代Trillium相比，Ironwood在功率效率上提高了2倍，具有192 GB的高带宽内存（HBM），1.2 TBps的双向ICI带宽。
谷歌DeepMind利用AI加速TPU设计过程，使用AlphaChip方法优化芯片设计。
谷歌认为AlphaChip有潜力优化芯片设计的每个阶段，改变定制硬件的芯片设计。

❓

延伸问答

Ironwood TPU的主要用途是什么？

Ironwood TPU专为推理工作负载设计，能够处理大型语言模型和复杂推理任务。

Ironwood TPU与前一代Trillium相比有哪些优势？

Ironwood在功率效率上提高了2倍，内存带宽和计算能力也显著增强。

Ironwood TPU的计算能力如何？

每个Ironwood芯片的峰值计算能力为4614 TFLOPS，9216芯片配置的计算能力超过El Capitan超级计算机的24倍。

谷歌如何利用AI优化TPU设计？

谷歌DeepMind使用名为AlphaChip的AI方法来加速和优化TPU设计，产生超人类的芯片布局。

Ironwood TPU的内存配置是什么？

Ironwood每个芯片配备192 GB的高带宽内存（HBM），是Trillium的6倍。

Ironwood TPU的网络连接方式是什么？

Ironwood通过Inter-Chip Interconnect（ICI）网络连接，支持高带宽和低延迟的通信。

🏷️

标签

AI加速器 Ironwood TPU ai 大型语言模型推理谷歌

➡️

继续阅读

谷歌 SRE 重磅白皮书：当 AI 自动写出 10 倍代码，谁来阻止系统崩溃？
谷歌SRE发布白皮书，探讨生成式AI对软件工程的影响。随着AI加速代码生成，系统稳定性面临挑战。谷歌提出五个自治级别，强调AI在运维中的重要性，并介绍三大...
AI狂飙背后的“基建寒流”：全美数据中心建设遭遇系统性刹车
美国数据中心建设正经历剧烈退潮，2026年第一季度至少75个项目被叫停，投资额达1300亿美元。民众因电力、水资源、土地和房价等问题反对声浪上升，地方政府...
用 Rust 打造的 AI 应用管理后台，高性能、高扩展、全开源。
祺洛AI是一个基于Rust和Vue 3的AI聊天管理平台，提供多供应商接入、用户管理和套餐计费等功能，解决了AI供应商切换困难、用户用量控制和付费体系缺失...
当AI代理单独行动时，日志无法告诉你的信息
日志记录在现代安全和合规中至关重要，企业需生成可查询、可追溯的日志，以重建安全事件。随着AI的引入，日志需涵盖AI代理的操作。透明的审计日志成为企业采购的...
PagerDuty的首席人工智能官表示，大多数AI事故工具缺少一个关键层面
AI正在帮助软件团队更快发布代码，但也导致了更频繁的事故。为应对这一挑战，需要建立一个AI生态系统，通过标准化信息交换加速事故管理。AI代理需访问相关数据...
AI 博客问题挑战
文章讨论了作者对人工智能（AI）模型的看法，特别是深度学习和语言模型的演变。作者认为AI在提升生产力方面具有潜力，但也对其对人类福祉的影响表示担忧。尽管存...