本研究提出了一种元计划优化(MPO)框架,以提升大型语言模型代理在互动规划任务中的能力。MPO通过引入明确指导和根据任务反馈进行持续优化,显著提高了任务效率和泛化能力。实验结果表明,MPO优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。