马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
💡
原文中文,约2600字,阅读约需7分钟。
📝
内容提要
马斯克发布的Grok-4模型在“人类最后考试”中首次突破50%准确率,声称超越所有博士生。其训练量显著增加,工具整合后智能提升,展现出强大的推理和编程能力。未来将推出多模态Agent和视频生成模型。
🎯
关键要点
- 马斯克发布的Grok-4模型在“人类最后考试”中首次突破50%准确率。
- Grok-4的训练量是Grok-2的100倍、Grok-3的10倍,依靠xAI建设的20万卡计算集群。
- Grok-4在多个基准测试中表现优异,包括AIME25得分100%。
- Grok-4展示了强大的推理和编程能力,能够完成复杂任务。
- 未来将推出多模态Agent和视频生成模型。
- Grok-4的发布经历了一些波折,原定版本为Grok-3,但最终决定发布Grok-4。
- Grok将成为特斯拉中的语音助手,支持多种语言。
- 马斯克确认擎天柱人形机器人将搭载Grok语音助手。
❓
延伸问答
Grok-4模型的准确率突破了多少?
Grok-4模型在“人类最后考试”中首次突破50%准确率。
Grok-4的训练量相比于之前的版本有何变化?
Grok-4的训练量是Grok-2的100倍、Grok-3的10倍。
Grok-4在AIME25测试中的表现如何?
Grok-4在AIME25测试中得分100%。
Grok-4未来有哪些计划?
未来将推出多模态Agent和视频生成模型。
Grok-4在编程能力方面的表现如何?
Grok-4在Live Coding Bench编程测试中几乎满分。
Grok-4如何提升其智能水平?
Grok-4通过在训练中原生融入工具,提升了智能水平。
➡️