小红花·文摘

本研究提出了一种基于视觉语言模型（VLM）的迭代关键点奖励（IKER）方法，旨在解决开放世界环境中的机器人操控任务规范挑战。IKER通过动态优化奖励函数，提高机器人在多步骤操控中的精确性和灵活性，实验证明其在动态环境中的有效性。