内容提要
谷歌于周四推出Gemini 3.1 Pro模型,尽管仍处于预览阶段,但在解决复杂问题上表现优于前版本,推理基准测试得分77.1%。Gemini 3 Deep Think专为推理设计,表现更佳,但仅限特定用户。该模型在GDPval-AA基准测试中得分1317,编码基准表现良好,价格保持不变,开发者可通过多平台访问。
关键要点
-
谷歌推出Gemini 3.1 Pro模型,仍处于预览阶段,解决复杂问题的能力优于前版本。
-
Gemini 3 Deep Think专为推理设计,表现更佳,但仅限特定用户使用。
-
Gemini 3.1 Pro在ARC-AGI-2基准测试中得分77.1%,显著高于前代模型的31.1%。
-
在GDPval-AA基准测试中,Gemini 3.1 Pro得分1317,低于Anthropic的Sonnet 4.6的1633分。
-
在编码基准测试中,Gemini 3.1 Pro表现优于大多数竞争对手。
-
新模型的定价保持不变,每百万输入/输出令牌为2美元/12美元,性价比高于Anthropic的Opus 4.6。
-
Gemini 3.1 Pro通过多种平台可供开发者使用,包括Google AI Studio和Android Studio。
延伸解读
Gemini 3.1 Pro的推理能力
Gemini 3.1 Pro在推理基准测试中表现出色,得分77.1%,显著高于前代模型的31.1%。这一提升表明,谷歌在复杂问题解决能力上取得了显著进展,尤其是在与Anthropic和OpenAI的竞争中,显示出其技术的进步。
市场竞争与定价策略
尽管Gemini 3.1 Pro在多个基准测试中表现优异,但在GDPval-AA测试中得分低于Anthropic的Sonnet 4.6,这可能影响其市场接受度。定价方面,Gemini 3.1 Pro的性价比高于竞争对手,保持在每百万输入/输出令牌2美元/12美元,适合开发者和企业使用。
可用性与访问限制
虽然Gemini 3.1 Pro仍处于预览阶段,但其已通过多种平台广泛可用,包括Google AI Studio和Android Studio。这为开发者提供了便利,但需要注意的是,Gemini 3 Deep Think模型仅限特定用户使用,可能限制了其更高性能的获取。
延伸问答
Gemini 3.1 Pro的主要优势是什么?
Gemini 3.1 Pro在解决复杂问题方面表现优于前版本,推理基准测试得分达到77.1%。
Gemini 3 Deep Think与Gemini 3.1 Pro有什么区别?
Gemini 3 Deep Think专为推理设计,表现更佳,但仅限特定用户使用,而Gemini 3.1 Pro则更广泛可用。
Gemini 3.1 Pro在编码基准测试中的表现如何?
Gemini 3.1 Pro在大多数编码基准测试中表现优于竞争对手,尤其是在Terminal-Bench 2.0中表现突出。
Gemini 3.1 Pro的定价是多少?
Gemini 3.1 Pro的定价为每百万输入/输出令牌2美元/12美元,性价比高于Anthropic的Opus 4.6。
Gemini 3.1 Pro的可用性如何?
Gemini 3.1 Pro目前处于预览阶段,但已通过多种平台广泛提供,包括Google AI Studio和Android Studio。
Gemini 3.1 Pro在GDPval-AA基准测试中的表现如何?
在GDPval-AA基准测试中,Gemini 3.1 Pro得分1317,低于Anthropic的Sonnet 4.6的1633分。