量子位 ·

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外思考时间

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

谷歌发布Gemini 1.5，数学能力超越o1-preview，成本仅为其十分之一，几乎无延迟。包括Gemini-1.5-Pro-002和Gemini-1.5-Flash-002两个型号，性能在数学、长文本和多模态方面显著提升。价格降低，速率限制提高，输出速度加倍，延迟减少。视觉理解和代码生成能力增强，适合摘要和问答应用。音频转录准确率达99%。

🎯

关键要点

谷歌发布Gemini 1.5，数学能力超越o1-preview，成本仅为十分之一，几乎无延迟。
Gemini 1.5包括两个型号：Gemini-1.5-Pro-002和Gemini-1.5-Flash-002，性能在数学、长文本和多模态方面显著提升。
价格降低超过50%，速率限制提升2-3倍，输出速度加倍，延迟减少至原来的三分之一。
在MMLU-Pro上性能提高约7%，在MATH和HiddenMath基准测试中，Pro版本以86.5%的成绩超过o1-preview。
视觉理解和代码生成能力提升2%-7%，模型风格更简洁，易于使用并降低成本。
1.5pro输入token降价64%，输出token降价52%，增量缓存token降价64%，10月1日生效。
1.5 Flash的付费速率限制从1000RPM提高到2000RPM，1.5 Pro从360RPM提高到1000RPM。
音频转录准确率接近99%，在清晰音频情况下可达100%。
尽管数学能力提升，但仍有网友认为数学基准已饱和，无法与o1系列相提并论。
谷歌升级模型旨在推动OpenAI尽快发布新模型，争夺市场领导地位。

❓

延伸问答

谷歌Gemini 1.5的数学能力如何与o1-preview相比？

Gemini 1.5的数学能力超越o1-preview，Pro版本在MATH和HiddenMath基准测试中以86.5%的成绩领先。

Gemini 1.5的成本和性能有什么变化？

Gemini 1.5的成本仅为o1-preview的十分之一，性能在数学、长文本和多模态方面显著提升，输出速度加倍，延迟减少至原来的三分之一。

Gemini 1.5的音频转录准确率是多少？

Gemini 1.5的音频转录准确率接近99%，在清晰音频情况下可达100%。

Gemini 1.5的速率限制有何变化？

1.5 Flash的付费速率限制从1000RPM提高到2000RPM，1.5 Pro从360RPM提高到1000RPM。

Gemini 1.5的更新对开发者有什么影响？

Gemini 1.5的更新使模型更易于使用，降低了成本，并提升了整体性能，尤其在数学和多模态应用中。

Gemini 1.5的视觉理解能力如何？

Gemini 1.5在视觉理解方面有2%-7%的提升，能够顺利通过之前难倒其他视觉模型的测试。

🏷️