Micropaper ·

一分钟读论文：《同等预算下，单智能体为何胜过多智能体？》

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

斯坦福大学的研究表明，在相同的推理token预算下，单智能体系统在多跳推理任务中优于多智能体系统。单智能体在信息效率上更具优势，避免了多智能体系统中信息传递的损耗。实验结果显示，单智能体在多个模型和数据集上表现最佳，即使在轻度上下文退化时也保持领先。论文指出，多智能体系统的优势可能源于对特定问题的过拟合，而非真正的推理能力提升。

🎯

关键要点

斯坦福大学的研究表明，单智能体LLM系统在多跳推理任务上优于多智能体系统。
单智能体系统在信息效率上更具优势，避免了多智能体系统中信息传递的损耗。
实验结果显示，单智能体在多个模型和数据集上表现最佳，且在轻度上下文退化时仍保持领先。
多智能体系统的优势可能源于对特定问题的过拟合，而非真正的推理能力提升。
论文通过实验验证了单智能体在推理token预算匹配的情况下是最强的默认架构。

🔎

延伸解读

单智能体的优势分析

研究表明，单智能体系统在多跳推理任务中表现优于多智能体系统，主要原因在于其信息处理效率更高。单智能体避免了多智能体系统中因信息传递而导致的损耗，这使得其在相同的推理token预算下能够更有效地利用上下文信息。

多智能体系统的局限性

尽管多智能体系统在某些情况下可能表现出优势，但研究指出，这种优势往往源于对特定问题的过拟合，而非真正的推理能力提升。这意味着在实际应用中，多智能体系统可能在面对多样化问题时表现不如单智能体系统。

上下文退化的影响

论文中提到的上下文退化实验显示，单智能体系统在轻度退化时仍能保持领先，但在重度退化情况下，多智能体系统可能会反超。这提示我们在设计智能体系统时，需要考虑上下文的有效利用率，以确保系统在不同条件下的鲁棒性。

❓

延伸问答

单智能体系统在多跳推理任务中有哪些优势？

单智能体系统在信息效率上更具优势，避免了多智能体系统中信息传递的损耗。

研究中使用了哪些模型和数据集进行实验？

实验使用了Qwen3-30B-A3B、DeepSeek-R1-Distill-Llama-70B、Gemini-2.5三个模型和FRAMES、MuSiQue两个多跳推理数据集。

多智能体系统的劣势是什么？

多智能体系统在信息传递中引入了额外的信息瓶颈，导致信息损耗，且可能对特定问题过拟合。

在轻度上下文退化时，单智能体的表现如何？

在轻度上下文退化时，单智能体仍然保持领先。

论文的核心发现是什么？

核心发现是单智能体系统在推理token预算匹配的情况下是最强的默认架构，性能优于或与最优系统无显著差异。

多智能体系统的优势是否真实存在？

多智能体系统的优势可能源于对特定问题的过拟合，而非真正的推理能力提升。

🏷️