极道 ·

谷歌第八代TPU芯片深度解析：针对智能体的121 ExaFlops算力怪兽

💡 原文中文，约7600字，阅读约需18分钟。

📝

内容提要

谷歌发布了第八代TPU芯片，提供121 ExaFlops的算力，旨在提升AI模型训练效率。然而，Gemini模型在编程智能体和工具调用方面表现不佳，存在死亡循环和错误调用问题，导致软件体验未能充分发挥硬件的潜力。开发者社区对谷歌的优先策略表示担忧，认为应更关注软件能力的提升。

🎯

关键要点

谷歌发布第八代TPU芯片TPU 8t和TPU 8i，提供121 ExaFlops算力，旨在提升AI模型训练效率。
TPU 8t专注于大规模模型训练，TPU 8i专注于高吞吐量推理任务，采用自研Axion ARM架构CPU和第四代液冷技术。
尽管硬件性能强大，Gemini模型在编程智能体和工具调用方面表现不佳，存在死亡循环和错误调用问题。
开发者社区对谷歌的优先策略表示担忧，认为应更关注软件能力的提升，而不是仅仅依赖硬件优势。
谷歌的效率优化覆盖整个技术栈，但软件体验的不足可能导致硬件潜力未能充分发挥。

❓

延伸问答

谷歌第八代TPU芯片的主要特点是什么？

谷歌第八代TPU芯片包括TPU 8t和TPU 8i，提供121 ExaFlops的算力，TPU 8t专注于大规模模型训练，TPU 8i专注于高吞吐量推理任务，采用自研Axion ARM架构CPU和第四代液冷技术。

Gemini模型在使用中存在哪些问题？

Gemini模型在编程智能体和工具调用方面表现不佳，存在死亡循环和错误调用问题，导致软件体验未能充分发挥硬件的潜力。

谷歌的开发者社区对TPU芯片的看法是什么？

开发者社区对谷歌的优先策略表示担忧，认为应更关注软件能力的提升，而不是仅仅依赖硬件优势。

TPU 8t和TPU 8i的设计目标是什么？

TPU 8t的设计目标是降低前沿模型的开发周期，将训练时间从数月缩短至数周；TPU 8i则旨在消除推理任务中的“等待室效应”。

谷歌在能效方面有哪些优化措施？

谷歌在能效方面的优化覆盖整个技术栈，包括动态调整功耗、集成电源管理和采用第四代液冷技术，使每瓦性能比上一代提升两倍。

TPU 8t的算力与全球超算的对比如何？

TPU 8t的单个计算单元提供121,000 PetaFlops的算力，是全球超算TOP500前十名总算力的十倍以上。

🏷️

继续阅读

美满电子将为谷歌TPU单元定制开发高效网络芯片并使用英特尔18A制程生产
谷歌与美满电子和英特尔合作，定制网络芯片以提升TPU单元性能。该芯片将由英特尔代工，预计2027年底量产，未来用于新数据中心。同时，谷歌与联发科共同开发T...
Google AdSense 广告拦截检测：技术原理解析与反拦截实战
本文介绍了广告拦截的原理及检测方法，包括浏览器扩展、DNS层拦截和浏览器内置拦截。检测广告是否被拦截的方法有诱饵元素、性能API和检测adsbygoogl...
这次谷歌相册的更新拯救了你的数字相框
谷歌的Ambient API更新使Aura数字相框用户可以自动更新幻灯片库，用户可直接从谷歌相册添加照片或同步整个相册。现有用户需重新连接相册以保持同步，...
英博数科亮相CCIG 2026，首次公开EBFlex私有化算力管理平台
2026年中国图象图形大会将在广州举行，重点关注图象图形与人工智能等前沿技术。英博数科展示了EBFlex私有化算力管理平台，旨在提升高校科研算力的供给与管...
谷歌发布并开源Gemma 4 12B版多模态模型可在16GB内存/显存上运行
谷歌发布了Gemma 4 12B多模态模型，支持文本、图片、视频和音频输入，能够在仅16GB内存的消费级设备上运行。该模型采用无编码器架构，降低延迟并简化...
构建新一代 AI Token 算力服务平台：KeyCompute 技术架构剖析
KeyCompute 是一个 AI Token 算力服务平台，旨在帮助中小企业和开发者管理多模型混用、账号池和计费等复杂链路。该平台使用 Rust 语言构...