研究人员开发了一种新型微型机器人,能够在11秒内完成10个连续翻滚,速度和加速度分别提高了450%和250%。该机器人采用AI控制系统,模仿昆虫的灵活飞行,未来可用于灾后搜救,且在复杂环境中表现出色,具备接近生物昆虫的敏捷性。
本研究利用强化学习算法(PPO和RPO)控制微型机器人群在水力影响下到达目标,展示了课程学习提升性能的能力。研究了智能微型游泳机器人的自主适应行为与最优策略学习,并提出了基于SwarMDP框架的逆向强化学习算法,有效生成本地奖励模型。
完成下面两步后,将自动完成登录并继续当前操作。