基于探索的错误纠正学习框架E2CL用于具身智能体
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对具身环境中智能体知识与环境知识不一致导致的行动不当问题,提出了一种新颖的基于探索的错误纠正学习(E2CL)框架。E2CL利用探索引发的错误和环境反馈,通过教师引导和无教师探索相结合,提高智能体的环境对齐能力,其在Virtualhome环境中的评估结果显示,相较于传统方法,E2CL训练的智能体在自我纠正能力上表现更优。
本研究提出了一种新的基于探索的错误纠正学习框架,用于解决具身环境中智能体行动不当的问题。通过教师引导和无教师探索相结合,提高智能体的环境对齐能力。在Virtualhome环境中的评估结果显示,E2CL训练的智能体在自我纠正能力上表现更优。