小红花·文摘

本文探讨了基于大型语言模型的智能代理在网络任务中的应用与挑战，提出了Self-MAP和MMInA等框架和基准任务，以提高代理的任务完成率和交互能力。实验表明，代理在复杂环境中的表现仍需提升，特别是在长时间任务中的工作记忆管理。