量子位 ·

谷歌杀回来了！新版Gemini跑分超o1登顶第一，CEO：这才哪到哪儿

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

谷歌新版Gemini（Exp 1114）超越OpenAI的o1，成为AI竞技场的领头羊，数学能力与o1相当，获得六项第一。尽管在编码和风格控制上表现不佳，但在视觉能力上领先。网友反馈褒贬不一，部分人质疑其是否为Gemini 2的预览版。

🎯

🔎

新版Gemini（Exp 1114）在数学能力上与OpenAI的o1不相上下，且在多个单项测试中表现优异。这表明谷歌在AI领域的竞争力正在增强，尤其是在复杂提示和创意写作方面。然而，Gemini在编码和风格控制上的不足，可能影响其在实际应用中的表现。

尽管Gemini（Exp 1114）在视觉能力上取得了领先，但用户反馈却褒贬不一，尤其是32k的上下文窗口引发了不少争议。部分用户认为这并未提升体验，反而降低了性能。这提示我们在使用新模型时，需关注其实际应用效果与用户体验。

关于Gemini（Exp 1114）是否为Gemini 2的预览版，网友们的猜测不断。部分人认为这是谷歌推迟发布Gemini 2的策略，先推出一个版本以缓解市场压力。这种策略可能会影响用户对未来产品的期待和信心，值得关注。

❓

新版Gemini在数学能力上与o1相当，并在复杂提示、创意写作、指令遵循等方面表现出色，获得六项第一。

Gemini（Exp 1114）在视觉能力上表现优异，超越了GPT-4o，获得了第一。

网友反馈褒贬不一，有人质疑其是否为Gemini 2的预览版，也有人对其表现表示满意。

在编码和风格控制上，Gemini（Exp 1114）表现不佳，未能进入前三。

部分网友质疑Gemini（Exp 1114）是否为Gemini 2的预览版，但并没有确凿证据支持这一说法。

Gemini（Exp 1114）拥有32k的上下文窗口，但这一点受到网友的吐槽，认为不如之前的200万上下文窗口。

🏷️