小红花·文摘

本研究提出了一种自我精炼方案，解决自主机器人在任务规划中的错误和前瞻性不足问题。通过迭代改进计划和端到端优化，简化了训练过程。实验表明，该方法在VirtualHome-Env测试中表现优异，提高了推理的可扩展性。