本研究提出了一种基于领导-追随多智能体近端策略优化的层次化框架,以提升多无人机空战的协同作战性能。该框架通过三层结构设计和角色优化,有效应对高维动作空间的挑战,并在模拟实验中验证了其效果。
本文介绍了一种全学习的层次化框架,可以同时学习低层控制器和高层潜在动作空间,并对多个机器人的运动进行泛化。通过模型预测控制方法计划连续潜在动作,成功实现了多个任务和两个模拟器上的优越表现。在六足机器人实验上,表现出了稳健性和样本效率。
本文介绍了一种利用层次化框架实现四足机器人路径跟踪任务的方法,为层次化深度学习提供理论支持。
该研究提出了一种基于物理的方法来合成全身手物交互。通过层次化框架、强化学习和物理仿真,学习身体和手部运动的技能先验,并使用新颖的奖励函数训练高层策略,控制手物交互。该方法成功完成了从接近物体到抓取和后续操纵的完整交互任务,并展示出比基于运动学的基线方法更具物理合理性的动作。
该研究提出了一种基于物理的方法来合成全身手物交互,通过层次化框架和强化学习,成功完成了从接近物体到抓取和后续操纵的完整交互任务,并展示出比基于运动学的基线方法更具物理合理性的动作。
该研究提出了一种基于物理的方法来合成全身手物交互,通过层次化框架、强化学习和物理仿真,成功完成了从接近物体到抓取和后续操纵的完整交互任务,并比基于运动学的基线方法更具物理合理性的动作。
完成下面两步后,将自动完成登录并继续当前操作。