国产大模型高考出分了:裸分683,选清华还是北大?

💡 原文中文,约4200字,阅读约需10分钟。
📝

内容提要

国产大模型高考成绩公布,豆包文科683分、理科648分排名第一,Gemini理科655分同样排名第一。整体表现优秀,但O3因语文写作失误分数较低。豆包有望进入清华、北大,评测标准基于山东省试卷,数学和语文表现良好,但图像理解和细节推理仍需提升。

🎯

关键要点

  • 国产大模型高考成绩公布,豆包文科683分、理科648分排名第一,Gemini理科655分同样排名第一。

  • 整体表现优秀,但O3因语文写作失误分数较低,仅95分。

  • 豆包有望进入清华、北大,评测标准基于山东省试卷,数学和语文表现良好。

  • 图像理解和细节推理仍需提升,尤其在图像题和复杂推理题上表现不佳。

  • 评测采用全国一卷和山东卷,评分方式参考高考判卷,确保公平性。

  • 大模型在数学、语文、英语等科目表现良好,但作文写作存在问题。

  • 豆包大模型1.6系列通过多模态融合和长上下文能力提升,表现优异。

  • 深度思考能力和动态思考能力的引入,帮助模型在复杂问题上取得更好成绩。

  • 图文结合的测试显示,Seed1.6-Thinking在生物和化学科目上表现提升显著。

  • 未来全模态推理将是值得深入探索的方向。

延伸问答

豆包和Gemini的高考成绩分别是多少?

豆包文科683分、理科648分,Gemini理科655分。

O3的语文成绩为何较低?

O3因语文写作失误,语文成绩仅95分。

豆包有望进入哪些大学?

豆包有望进入清华大学或北京大学。

评测标准是如何制定的?

评测采用全国一卷和山东卷,评分参考高考判卷方式,确保公平性。

豆包大模型的能力提升主要依靠哪些技术?

豆包通过多模态融合、深度思考能力和动态思考能力等技术提升能力。

大模型在图像理解方面存在哪些不足?

大模型在图像理解和细节推理上表现不佳,尤其在图像题和复杂推理题上。

➡️

继续阅读