The New Stack ·

谷歌的Gemini 3.1 Pro表现大致优秀

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

谷歌于周四推出Gemini 3.1 Pro模型，尽管仍处于预览阶段，但在解决复杂问题上表现优于前版本，推理基准测试得分77.1%。Gemini 3 Deep Think专为推理设计，表现更佳，但仅限特定用户。该模型在GDPval-AA基准测试中得分1317，编码基准表现良好，价格保持不变，开发者可通过多平台访问。

🎯

关键要点

谷歌推出Gemini 3.1 Pro模型，仍处于预览阶段，解决复杂问题的能力优于前版本。
Gemini 3 Deep Think专为推理设计，表现更佳，但仅限特定用户使用。
Gemini 3.1 Pro在ARC-AGI-2基准测试中得分77.1%，显著高于前代模型的31.1%。
在GDPval-AA基准测试中，Gemini 3.1 Pro得分1317，低于Anthropic的Sonnet 4.6的1633分。
在编码基准测试中，Gemini 3.1 Pro表现优于大多数竞争对手。
新模型的定价保持不变，每百万输入/输出令牌为2美元/12美元，性价比高于Anthropic的Opus 4.6。
Gemini 3.1 Pro通过多种平台可供开发者使用，包括Google AI Studio和Android Studio。

🔎

延伸解读

Gemini 3.1 Pro的推理能力

Gemini 3.1 Pro在推理基准测试中表现出色，得分77.1%，显著高于前代模型的31.1%。这一提升表明，谷歌在复杂问题解决能力上取得了显著进展，尤其是在与Anthropic和OpenAI的竞争中，显示出其技术的进步。

市场竞争与定价策略

尽管Gemini 3.1 Pro在多个基准测试中表现优异，但在GDPval-AA测试中得分低于Anthropic的Sonnet 4.6，这可能影响其市场接受度。定价方面，Gemini 3.1 Pro的性价比高于竞争对手，保持在每百万输入/输出令牌2美元/12美元，适合开发者和企业使用。

可用性与访问限制

虽然Gemini 3.1 Pro仍处于预览阶段，但其已通过多种平台广泛可用，包括Google AI Studio和Android Studio。这为开发者提供了便利，但需要注意的是，Gemini 3 Deep Think模型仅限特定用户使用，可能限制了其更高性能的获取。

❓

延伸问答

Gemini 3.1 Pro的主要优势是什么？

Gemini 3.1 Pro在解决复杂问题方面表现优于前版本，推理基准测试得分达到77.1%。

Gemini 3 Deep Think与Gemini 3.1 Pro有什么区别？

Gemini 3 Deep Think专为推理设计，表现更佳，但仅限特定用户使用，而Gemini 3.1 Pro则更广泛可用。

Gemini 3.1 Pro在编码基准测试中的表现如何？

Gemini 3.1 Pro在大多数编码基准测试中表现优于竞争对手，尤其是在Terminal-Bench 2.0中表现突出。

Gemini 3.1 Pro的定价是多少？

Gemini 3.1 Pro的定价为每百万输入/输出令牌2美元/12美元，性价比高于Anthropic的Opus 4.6。

Gemini 3.1 Pro的可用性如何？

Gemini 3.1 Pro目前处于预览阶段，但已通过多种平台广泛提供，包括Google AI Studio和Android Studio。

Gemini 3.1 Pro在GDPval-AA基准测试中的表现如何？

在GDPval-AA基准测试中，Gemini 3.1 Pro得分1317，低于Anthropic的Sonnet 4.6的1633分。

🏷️