量子位 ·

Qwen版o1发布即开源！32B参数比肩OpenAI o1-mini，一手实测在此

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

通义千问版QwQ模型发布，参数量32B，开源并支持多个平台。尽管推理能力与o1-mini相当，但回答较冗长，需改进简洁性。测试显示其在逻辑和数学题上表现良好，但偶尔出现错误。整体而言，QwQ的推理效率仍需提升。

🎯

🔎

通义千问版QwQ模型的开源特性使得开发者和研究者能够自由使用和修改。这一特性不仅降低了使用门槛，还促进了社区的参与和反馈，有助于模型的快速迭代和优化。开源模型在教育和科研领域的应用潜力巨大，尤其是在需要定制化解决方案的场景中。

尽管QwQ在逻辑和数学题上表现良好，但其回答的冗长性和复杂性可能影响用户体验。相比之下，o1-mini的简洁回答更易于理解。未来的改进方向应集中在提升推理效率和简洁性，以增强模型的实用性和用户友好性。

QwQ在处理陷阱问题时未能识别关键点，显示出大模型普遍存在的缺陷。这一现象提醒用户在使用AI模型时需保持警惕，特别是在涉及复杂逻辑或文字游戏的场景中。模型的推理能力虽然在不断提升，但仍需加强对问题细节的关注。

❓

QwQ模型的参数量为32B。

QwQ在逻辑和数学题上表现良好，但偶尔出现错误，推理效率需提升。

QwQ的回答通常较长，且在逻辑推理中存在冗余步骤，影响易读性。

是的，QwQ模型是开源的，并支持多个平台。

QwQ在GPQA上表现优于o1-mini，但回答较冗长，需要改进简洁性。

通义团队承认QwQ在测试阶段存在冗长和不够聚焦的问题，将进行改进。

🏷️