COMPOSER: 蛇形机器人的可扩展和稳健的模块化策略
原文中文,约300字,阅读约需1分钟。发表于: 。我们提出了一种控制策略,通过将蛇形机器人视为模块化机器人,并将其控制形式化为合作多智能体强化学习问题,以有效降低蛇形机器人的高维度,并利用其冗余性,通过自注意机制增强智能体之间的合作行为,并引入高层次想象策略以提供额外奖励来指导低层控制策略。我们的方法 COMPOSER...
该文介绍了一种名为COMPOSER的控制策略,将蛇形机器人视为模块化机器人,并将其控制形式化为合作多智能体强化学习问题,以提高其合作行为和降低高维度。COMPOSER在五个任务中取得了最高的成功率,并证明了其对模块损坏的增强鲁棒性和显着的零-shot泛化能力的优势。