大型语言模型在交互式规划中表现出色。本文介绍了参数化世界知识模型(WKM),通过自我合成知识和提供任务与状态知识来改进规划。实验显示,该方法在复杂数据集上减少了盲目试错和幻觉行为,增强了对世界的理解。WKM具有良好的泛化性能,弱WKM能指导强代理模型,统一训练WKM有潜力。
完成下面两步后,将自动完成登录并继续当前操作。