量子位 ·

6小时复刻AI IMO金牌成果，蚂蚁多智能体新进展已开源

💡 原文中文，约3600字，阅读约需9分钟。

📝

内容提要

AWorld项目团队在IMO 2025展示了多智能体协作的优势，成功复现DeepMind的解题结果。通过自我进化和动态构建高质量输入，多智能体系统在解题效率和准确性上超越单一模型，实验表明多智能体协作是提升群体智能的有效途径。

🎯

🔎

AWorld项目展示了多智能体系统在复杂问题解决中的潜力。通过自我进化和动态构建高质量输入，这种系统能够超越单一模型的局限，提升解题效率和准确性。尤其在IMO级别的数学题中，多智能体协作显著提高了解题能力，显示出其在群体智能提升方面的有效性。

IMO 2025的结果揭示了单模模型在复杂推理问题上的不足。尽管一些顶尖模型在比赛中表现出色，但面对IMO级别的题目，单个模型几乎无法一次性推理出正确答案。这一现象强调了多智能体协同的重要性，表明未来的智能系统可能需要依赖于多智能体的合作来解决更复杂的任务。

AWorld通过角色定义实现了元认知能力，使系统能够自我评估和修正解决方案。这种能力不仅提升了解题的合理性，还避免了单一模型可能出现的思维定式。元认知的引入为多智能体系统提供了更高层次的智能，使其在复杂问题解决中更具优势。

❓

AWorld项目团队在IMO 2025中成功复现并开源了DeepMind的5/6道解题结果。

多智能体系统通过自我进化和动态构建高质量输入，超越单一模型的解题效率和准确性。

IMO 2025揭示了单模模型在复杂推理问题上的局限性，单个模型难以解决IMO级别的数学题。

AWorld采用双智能体对话机制，其中做题家生成解答，验证者进行验证，通过多轮对话迭代优化解答质量。

多智能体协作通过角色定义实现元认知，帮助系统评估解决方案的合理性，避免思维定式。

AWorld框架的核心优势是采用事件驱动的群体智能架构，超越传统框架的局限。

🏷️