本研究提出了一种基于视觉语言模型(VLM)的迭代关键点奖励(IKER)方法,旨在解决开放世界环境中的机器人操控任务规范挑战。IKER通过动态优化奖励函数,提高机器人在多步骤操控中的精确性和灵活性,实验证明其在动态环境中的有效性。
完成下面两步后,将自动完成登录并继续当前操作。