量子位 ·

姚顺宇谷歌首秀，Gemini新模型刷爆SOTA：人类仅剩7人捍卫碳基编程

💡 原文中文，约3200字，阅读约需8分钟。

📝

内容提要

谷歌推出的Gemini 3 Deep Think模型在多项基准测试中表现优异，Elo分数达到3455，仅次于7名人类程序员。该模型在AI推理能力测试中得分84.6%，并在科研领域降低推理成本82%。清华校友姚顺宇参与了该模型的开发，展现出强大的科学应用潜力。

🎯

🔎

Gemini 3 Deep Think在多个基准测试中刷新了SOTA，尤其是在AI推理能力测试ARC-AGI-2中取得了84.6%的高分。这一成绩不仅超越了之前的模型，也显示出其在处理复杂推理任务方面的强大能力，可能会对未来的AI应用产生深远影响。

Gemini 3 Deep Think的推理成本降低了82%，每项任务仅需13.62美元。这一变化使得高效的AI应用变得更加经济，可能会推动更多科研和工程项目的实施，尤其是在资源有限的情况下。

Gemini 3 Deep Think的研发团队中有多位华人科学家，包括姚顺宇和Yi Tay，他们在AI和大语言模型领域的丰富经验为模型的成功奠定了基础。这一团队的多样性和专业背景可能是推动技术进步的重要因素。

❓

Gemini 3 Deep Think模型在Codeforces上取得了3455 Elo分数。

在ARC-AGI-2测试中，Gemini 3 Deep Think得分为84.6%。

姚顺宇参与了Gemini 3 Deep Think的开发，展现出其在科研领域的应用能力。

Gemini 3 Deep Think的推理成本降低了82%，每项任务仅需13.62美元。

该模型可以分析草图、生成3D打印文件，并识别复杂数学论文中的逻辑缺陷。

Gemini 3 Deep Think在化学和物理领域取得了金牌级别的成绩。

🏷️