小红花·文摘

本研究提出了一种元计划优化（MPO）框架，以提升大型语言模型代理在互动规划任务中的能力。MPO通过引入明确指导和根据任务反馈进行持续优化，显著提高了任务效率和泛化能力。实验结果表明，MPO优于现有方法。