马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分

💡 原文中文,约2600字,阅读约需7分钟。
📝

内容提要

马斯克发布的Grok-4模型在“人类最后考试”中首次突破50%准确率,声称超越所有博士生。其训练量显著增加,工具整合后智能提升,展现出强大的推理和编程能力。未来将推出多模态Agent和视频生成模型。

🎯

关键要点

  • 马斯克发布的Grok-4模型在“人类最后考试”中首次突破50%准确率。
  • Grok-4的训练量是Grok-2的100倍、Grok-3的10倍,依靠xAI建设的20万卡计算集群。
  • Grok-4在多个基准测试中表现优异,包括AIME25得分100%。
  • Grok-4展示了强大的推理和编程能力,能够完成复杂任务。
  • 未来将推出多模态Agent和视频生成模型。
  • Grok-4的发布经历了一些波折,原定版本为Grok-3,但最终决定发布Grok-4。
  • Grok将成为特斯拉中的语音助手,支持多种语言。
  • 马斯克确认擎天柱人形机器人将搭载Grok语音助手。

延伸问答

Grok-4模型的准确率突破了多少?

Grok-4模型在“人类最后考试”中首次突破50%准确率。

Grok-4的训练量相比于之前的版本有何变化?

Grok-4的训练量是Grok-2的100倍、Grok-3的10倍。

Grok-4在AIME25测试中的表现如何?

Grok-4在AIME25测试中得分100%。

Grok-4未来有哪些计划?

未来将推出多模态Agent和视频生成模型。

Grok-4在编程能力方面的表现如何?

Grok-4在Live Coding Bench编程测试中几乎满分。

Grok-4如何提升其智能水平?

Grok-4通过在训练中原生融入工具,提升了智能水平。

➡️

继续阅读