国产大模型高考出分了:裸分683,选清华还是北大?
💡
原文中文,约4200字,阅读约需10分钟。
📝
内容提要
国产大模型高考成绩公布,豆包文科683分、理科648分排名第一,Gemini理科655分同样排名第一。整体表现优秀,但O3因语文写作失误分数较低。豆包有望进入清华、北大,评测标准基于山东省试卷,数学和语文表现良好,但图像理解和细节推理仍需提升。
🎯
关键要点
-
国产大模型高考成绩公布,豆包文科683分、理科648分排名第一,Gemini理科655分同样排名第一。
-
整体表现优秀,但O3因语文写作失误分数较低,仅95分。
-
豆包有望进入清华、北大,评测标准基于山东省试卷,数学和语文表现良好。
-
图像理解和细节推理仍需提升,尤其在图像题和复杂推理题上表现不佳。
-
评测采用全国一卷和山东卷,评分方式参考高考判卷,确保公平性。
-
大模型在数学、语文、英语等科目表现良好,但作文写作存在问题。
-
豆包大模型1.6系列通过多模态融合和长上下文能力提升,表现优异。
-
深度思考能力和动态思考能力的引入,帮助模型在复杂问题上取得更好成绩。
-
图文结合的测试显示,Seed1.6-Thinking在生物和化学科目上表现提升显著。
-
未来全模态推理将是值得深入探索的方向。
❓
延伸问答
豆包和Gemini的高考成绩分别是多少?
豆包文科683分、理科648分,Gemini理科655分。
O3的语文成绩为何较低?
O3因语文写作失误,语文成绩仅95分。
豆包有望进入哪些大学?
豆包有望进入清华大学或北京大学。
评测标准是如何制定的?
评测采用全国一卷和山东卷,评分参考高考判卷方式,确保公平性。
豆包大模型的能力提升主要依靠哪些技术?
豆包通过多模态融合、深度思考能力和动态思考能力等技术提升能力。
大模型在图像理解方面存在哪些不足?
大模型在图像理解和细节推理上表现不佳,尤其在图像题和复杂推理题上。
➡️