小红花·文摘

本文介绍了一种新颖的方法，利用大型语言模型定义奖励参数，结合实时优化器MuJoCo MPC，优化和实现各种机器人任务。作者在模拟仿真机器人和机械手上进行了17个任务的评价，成功解决了90%的任务，并在真实机器人手臂上验证了方法的有效性。