The New Stack ·

谷歌人工智能基础设施产品经理谈新款TPU、液冷技术及更多

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

谷歌在Cloud Next 25大会上推出了新款TPU加速器Ironwood，性能显著提升。每个模块包含9216个芯片，总计算能力达到42.5 exaflops，功耗性能提升2倍。谷歌采用液冷系统保持TPU温度，客户在选择TPU或GPU时需考虑工作负载。尽管硬件不断进步，模型架构变化更快，谷歌与DeepMind的合作助力前瞻性设计。

🎯

关键要点

谷歌在Cloud Next 25大会上推出了新款TPU加速器Ironwood，性能显著提升。
每个Ironwood模块包含9216个芯片，总计算能力达到42.5 exaflops，功耗性能提升2倍。
谷歌采用液冷系统来保持TPU温度，液冷技术经历了多代演变。
客户在选择TPU或GPU时需考虑工作负载和使用案例，部分团队可能需要NVIDIA框架。
硬件不断进步，但模型架构变化更快，谷歌与DeepMind的合作助力前瞻性设计。

❓

延伸问答

新款TPU Ironwood的性能如何？

Ironwood每个模块包含9216个芯片，总计算能力达到42.5 exaflops，功耗性能提升2倍。

谷歌是如何保持TPU的温度的？

谷歌采用液冷系统来保持TPU温度，这是其第四代液冷技术。

客户在选择TPU和GPU时需要考虑什么？

客户需考虑工作负载和使用案例，有时需要NVIDIA框架来加速工作。

谷歌与DeepMind的合作对TPU设计有什么影响？

与DeepMind的合作帮助谷歌前瞻性设计硬件，以应对快速变化的模型架构。

TPU的硬件进步与模型架构变化的关系是什么？

尽管硬件每年进步，但模型架构变化更快，谷歌需不断适应。

使用TPU的客户有哪些成功案例？

例如，Moloco将训练应用从CPU迁移到TPU后实现了10倍的性能提升。

🏷️

继续阅读

谷歌员工要求桑达尔·皮查伊拒绝将人工智能用于机密军事用途
超过600名谷歌员工签署信件，要求首席执行官皮查伊拒绝国防部使用其人工智能模型进行机密工作，强调拒绝此类任务以避免与潜在危害相关联。这反映了员工对公司与军事合作的担忧。
流媒体的未来：技术如何塑造观看体验
流媒体行业在过去十年经历了巨大变革，成为主要媒体消费方式。AI和机器学习提升了用户体验和内容创作效率，5G技术将进一步改善流媒体质量。尽管面临内容盗版和信...
谷歌正在测试用于YouTube的AI聊天机器人搜索
谷歌正在测试一种名为“Ask YouTube”的新搜索方式，旨在提供更对话式的搜索体验。该功能允许用户获取长视频、短视频和相关文本信息，目前仅对美国的Yo...
微软与OpenAI的重写为Anthropic和谷歌打开了大门
OpenAI与微软重新调整合作协议，旨在简化合作方式并增强灵活性。OpenAI将能够在其他云平台提供服务，而微软希望发展自己的AI模型。尽管两者关系紧张，...
为什么人工智能工程需要传统的纪律
许多公司在将人工智能项目从概念验证转向生产时面临挑战。Thoughtworks的Nimisha Asthagiri指出，成功的公司应重新思考技术应用，而非...
欢迎来到人工智能的“发现”阶段
AI行业正经历转型，进入“发现”阶段。企业需提供真实价值以赢得客户信任，信任和可靠性成为关键。AI系统需具备高可靠性以避免错误，企业关注盈利，AI应用的社...