机器之心 ·

推理水平对标OpenAI o1！阿里云通义开源最新推理模型QwQ

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

阿里云通义团队于11月28日发布了开源AI推理模型QwQ-32B-Preview，该模型在数学和编程方面表现优异，具备研究生水平的科学推理能力，并在多个评测中取得高分，展现出深度自省能力。尽管存在一些局限性，开发者对其表现给予高度评价，认为这是开源领域的重要突破。

🎯

❓

QwQ模型在数学和编程方面表现优异，具备研究生水平的科学推理能力，并展现出深度自省能力。

在GPQA评测中，QwQ获得65.2%的准确率，在AIME评测中胜率为50%，在MATH-500评测中获得90.6%的高分。

QwQ-32B-Preview已在魔搭社区和HuggingFace等平台上开源，受到全球开发者的热情体验。

QwQ模型存在语言混合、偶有不恰当偏见和对专业领域知识不足等局限性。

QwQ模型能够质疑自身假设，进行深思熟虑的自我对话，仔细审视推理过程的每一步。

开发者认为QwQ是开源领域的重要突破，表现出完全没有预料到的进步。

🏷️