Google DeepMind Blog ·

Gemini 2.5：我们最智能的模型正在变得更好

💡 原文英文，约1400词，阅读约需6分钟。

📝

内容提要

谷歌DeepMind发布了Gemini 2.5模型系列的更新，包括2.5 Pro和2.5 Flash。2.5 Pro在学术基准和编码领域表现优异，新增Deep Think推理模式，提升复杂数学和编码能力。2.5 Flash在效率和多模态处理上有所改善，新增原生音频输出和增强的安全性，旨在提升开发者体验和用户交互。

🎯

关键要点

谷歌DeepMind发布了Gemini 2.5模型系列的更新，包括2.5 Pro和2.5 Flash。
2.5 Pro在学术基准和编码领域表现优异，新增Deep Think推理模式，提升复杂数学和编码能力。
2.5 Flash在效率和多模态处理上有所改善，新增原生音频输出和增强的安全性。
2.5 Pro在WebDev Arena和LMArena排行榜上表现领先，成为学习领域的领先模型。
Deep Think模式能够考虑多个假设，提升推理能力，并在多个数学和编码基准测试中表现出色。
2.5 Flash模型在推理、多模态、代码和长上下文方面的性能有所提升，使用效率提高20-30%。
新增的Live API支持音频-视觉输入和原生音频输出，提升对话体验。
Gemini 2.5 Pro和Flash将包括思维摘要功能，帮助开发者更好地理解模型的思考过程。
安全性方面，Gemini 2.5增强了对安全威胁的保护，成为迄今为止最安全的模型系列。

🔎

延伸解读

Deep Think模式的潜力

Gemini 2.5 Pro引入的Deep Think推理模式，能够考虑多个假设，提升复杂数学和编码的推理能力。这一模式在多个基准测试中表现出色，显示出其在学术和实际应用中的潜力，尤其适合需要高水平推理的任务。

2.5 Flash的效率提升

2.5 Flash模型在推理和多模态处理方面的效率提高了20-30%。这种提升不仅降低了开发成本，还能加快响应速度，使得开发者在构建应用时能够更灵活地应对用户需求。

安全性增强的重要性

Gemini 2.5在安全性方面进行了显著增强，特别是对抗间接提示注入攻击的保护。这一改进对于企业用户尤为重要，因为它能有效降低潜在的安全风险，确保模型在实际应用中的可靠性。

开发者体验的优化

新版本的Gemini 2.5 Pro和Flash引入了思维摘要功能，帮助开发者更好地理解模型的思考过程。这种透明度的提升将有助于开发者在调试和优化应用时，快速识别问题并进行调整。

❓

延伸问答

Gemini 2.5 Pro的主要特点是什么？

Gemini 2.5 Pro在学术基准和编码领域表现优异，新增Deep Think推理模式，提升复杂数学和编码能力。

Gemini 2.5 Flash有哪些改进？

Gemini 2.5 Flash在效率和多模态处理上有所改善，新增原生音频输出和增强的安全性，使用效率提高20-30%。

Deep Think推理模式的作用是什么？

Deep Think推理模式能够考虑多个假设，提升推理能力，并在复杂数学和编码基准测试中表现出色。

Gemini 2.5模型如何提升开发者体验？

Gemini 2.5模型通过引入思维摘要功能和思维预算，帮助开发者更好地理解模型的思考过程和控制成本。

Gemini 2.5在安全性方面有哪些增强？

Gemini 2.5增强了对安全威胁的保护，显著提高了对间接提示注入攻击的防护率，成为最安全的模型系列。

Gemini 2.5的Live API有什么新功能？

Live API新增音频-视觉输入和原生音频输出，支持更自然的对话体验，并允许用户调整语调和风格。

🏷️