谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
💡
原文中文,约1600字,阅读约需4分钟。
📝
内容提要
谷歌发布Gemini 1.5,数学能力超越o1-preview,成本仅为其十分之一,几乎无延迟。包括Gemini-1.5-Pro-002和Gemini-1.5-Flash-002两个型号,性能在数学、长文本和多模态方面显著提升。价格降低,速率限制提高,输出速度加倍,延迟减少。视觉理解和代码生成能力增强,适合摘要和问答应用。音频转录准确率达99%。
🎯
关键要点
- 谷歌发布Gemini 1.5,数学能力超越o1-preview,成本仅为十分之一,几乎无延迟。
- Gemini 1.5包括两个型号:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002,性能在数学、长文本和多模态方面显著提升。
- 价格降低超过50%,速率限制提升2-3倍,输出速度加倍,延迟减少至原来的三分之一。
- 在MMLU-Pro上性能提高约7%,在MATH和HiddenMath基准测试中,Pro版本以86.5%的成绩超过o1-preview。
- 视觉理解和代码生成能力提升2%-7%,模型风格更简洁,易于使用并降低成本。
- 1.5pro输入token降价64%,输出token降价52%,增量缓存token降价64%,10月1日生效。
- 1.5 Flash的付费速率限制从1000RPM提高到2000RPM,1.5 Pro从360RPM提高到1000RPM。
- 音频转录准确率接近99%,在清晰音频情况下可达100%。
- 尽管数学能力提升,但仍有网友认为数学基准已饱和,无法与o1系列相提并论。
- 谷歌升级模型旨在推动OpenAI尽快发布新模型,争夺市场领导地位。
➡️