量子位 ·

突破Claude-4编程上限！自进化Agent框架拿下新SOTA，已开源

💡 原文中文，约3200字，阅读约需8分钟。

📝

内容提要

中科院与清华大学等提出的SE-Agent框架突破了Claude-4的编程限制，提升了多步推理能力，成功率提高20.6%。该框架通过轨迹协同进化优化解决方案，刷新了开源框架的性能记录，展现出智能体自我改进的潜力。

🎯

🔎

SE-Agent框架通过引入集体进化的理念，突破了传统智能体的局限。其三大进化算子——修订、重组和精炼，能够有效提升智能体的推理能力和解决方案多样性。这种方法不仅提高了成功率，还为智能体的自我改进提供了新的路径，展现出更强的适应性和灵活性。

传统智能体往往将每次尝试视为独立事件，容易陷入局部最优解。而SE-Agent通过轨迹间的协同进化，促进了知识共享和跨轨迹学习，显著提高了解决复杂问题的能力。这种集体智慧的机制使得SE-Agent在面对挑战时，能够更有效地探索解决方案空间，避免思维定势。

研究团队计划将SE-Agent的自进化思想扩展到更广泛的路径搜索问题中，如强化学习和具身智能规划。这一方向的探索不仅有助于推动通用人工智能的发展，也可能为其他领域的智能体应用提供新的思路和方法，值得关注。

❓

SE-Agent框架的主要创新点在于引入了集体进化的概念，通过修订、重组和精炼三大核心操作，实现智能体的自我改进和多步推理能力的提升。

SE-Agent通过轨迹协同进化优化解决方案，促进不同轨迹之间的知识共享和相互启发，从而提升多步推理能力，成功率提高20.6%。

在SWE-bench Verified基准上，SE-Agent在所有测试的LLM上实现了显著的性能提升，Claude-3.7-Sonnet的首次尝试成功率达到了61.2%。

SE-Agent的三大进化算子是修订（深度自省与定向改进）、重组（跨轨迹的知识共享）和精炼（多维评估与优化选择）。

SE-Agent通过轨迹的重组与进化，强迫智能体探索不同的解决方向，从而有效避免了“隧道视野”，发现更为关键的解决方案。

未来，研究团队计划将SE-Agent的自进化思想扩展到更广泛的路径搜索问题中，如强化学习策略发现和具身智能规划，以推动通用人工智能的发展。

🏷️