InfoQ ·

谷歌发布Ironwood TPU，专为AI推理设计

💡 原文英文，约800词，阅读约需3分钟。

📝

内容提要

谷歌在Cloud Next 25上发布了第七代Tensor处理单元（TPU）Ironwood，专为推理工作负载设计，支持9216个液冷芯片，具备强大计算能力，能够处理大型语言模型和复杂推理任务，推动主动AI模型的发展。

🎯

关键要点

谷歌在Cloud Next 25上发布了第七代Tensor处理单元（TPU）Ironwood，专为推理工作负载设计。
Ironwood是谷歌迄今为止性能最强、可扩展性最高的定制AI加速器，专门用于推理工作负载。
Ironwood支持9216个液冷芯片，连接使用Inter-Chip Interconnect（ICI）网络，是谷歌云AI超计算机架构的关键组成部分。
Ironwood能够处理大型语言模型（LLMs）、专家混合（MoEs）和高级推理任务，减少数据移动和延迟。
Ironwood提供256芯片和9216芯片配置，9216芯片的计算能力超过El Capitan超级计算机的24倍。
Ironwood每个芯片的峰值计算能力为4614 TFLOPS，具有增强的SparseCore加速器，适用于超大嵌入处理。
与前一代Trillium相比，Ironwood在功率效率上提高了2倍，具有192 GB的高带宽内存（HBM），1.2 TBps的双向ICI带宽。
谷歌DeepMind利用AI加速TPU设计过程，使用AlphaChip方法优化芯片设计。
谷歌认为AlphaChip有潜力优化芯片设计的每个阶段，改变定制硬件的芯片设计。

🏷️

继续阅读

上下文衰退如何影响企业AI和大型语言模型（LLM）的结果，以及如何解决这一问题
上下文衰退影响企业AI和大型语言模型（LLM）的表现。旧数据未被清除，导致信息混乱和推理能力下降。企业需监控关键数据指标，清除过时数据，以提升AI的准确性和效率。
Intention Is All You Need
文章《AI 是一种编程框架》强调了意图在软件开发中的重要性。随着大型语言模型（LLM）的出现，开发者可以直接将意图转化为软件，简化了开发流程，程序员只需表...
Qt Group与高通合作，简化工业AI设备开发流程
Qt Group与高通合作，优化Qt框架以支持高通物联网处理器，简化边缘AI设备的开发。开发者可通过Qt Edge AI API轻松实现复杂应用，无需深入...
OpenAI宣布收购AI安全初创公司Promptfoo 可以提高智能体的安全防御能力
OpenAI 收购了 AI 安全初创公司 Promptfoo，旨在提升 AI 智能体的安全性。Promptfoo 成立于 2024 年，估值 8600 万...
80%营销人员感受到采用AI的压力，但仅6%在工作流程中完全应用AI
Supermetrics发布的报告显示，80%的营销人员感受到应用AI的压力，但仅6%完全使用AI。压力主要来自高层，52%的受访者的数据战略由外部团队定...
喜报！谷歌推出官方CLI工具帮助OpenClaw操作邮箱这下没有封号风险
谷歌推出了一款官方CLI工具，旨在安全连接Gmail等服务，支持个人和企业账户，并内置40多种智能技能。该工具可与OpenClaw集成，实现操作自动化，但...

谷歌发布Ironwood TPU，专为AI推理设计

内容提要

关键要点

标签

继续阅读