本研究提出了一种语言指导偏好学习(LGPL)方法,旨在优化机器人在社会环境中的互动行为。该方法结合预训练语言模型与偏好学习,仅需四个查询即可快速学习出准确且富有表现力的四足动物行为,显著提高样本效率。
本文提出了一种基于扩散模型的四足动物运动方法,解决了多技能学习和离线适应新运动行为的挑战。该框架首次应用无分类器引导扩散,展示了其与多技能策略的兼容性及低计算开销。
本研究结合模型控制与强化学习,开发了四足动物的鲁棒控制器,提升了其在复杂环境中的适应性和能源效率。实验表明,该控制策略在真实环境中实现了高鲁棒性和节能,推动了机器人技术的发展。
该研究提出了一种从合成动物数据集学习语义部分分割的方法,通过改进现有的领域自适应方法,实现了更广泛的姿态多样性。研究在PartImageNet上验证了该方法的有效性,并展示了合成虎和马的学习部分在所有四足动物上的可传递性。
完成下面两步后,将自动完成登录并继续当前操作。