在线学习共享自治中的人类约束
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究提出了一个利用无人干预的关节行动示范学习人类用户模型的框架,以便机器人能够计算出一项与人类的合作任务相适应的鲁棒策略。该方法通过无监督学习算法将示范动作序列聚集到不同的人类类型中,并使用逆强化学习算法学习代表每种类型的奖励函数。实验室中的演示验证了该方法,展示了同一个人类与小型工业机器人配合完成任务的可能性。
🎯
关键要点
- 该研究提出了一个无人干预的关节行动示范学习人类用户模型的框架。
- 该框架旨在帮助机器人计算与人类合作任务相适应的鲁棒策略。
- 使用无监督学习算法将示范动作序列聚集到不同的人类类型中。
- 采用逆强化学习算法学习每种类型的奖励函数。
- 实验室演示验证了该方法,展示了人类与小型工业机器人合作完成任务的可能性。
➡️