小红花·文摘

大型语言模型在交互式规划中表现出色。本文介绍了参数化世界知识模型（WKM），通过自我合成知识和提供任务与状态知识来改进规划。实验显示，该方法在复杂数据集上减少了盲目试错和幻觉行为，增强了对世界的理解。WKM具有良好的泛化性能，弱WKM能指导强代理模型，统一训练WKM有潜力。