本研究提出了一种自我精炼方案,解决自主机器人在任务规划中的错误和前瞻性不足问题。通过迭代改进计划和端到端优化,简化了训练过程。实验表明,该方法在VirtualHome-Env测试中表现优异,提高了推理的可扩展性。
完成下面两步后,将自动完成登录并继续当前操作。