该研究提出了一个利用无人干预的关节行动示范学习人类用户模型的框架,以便机器人能够计算出一项与人类的合作任务相适应的鲁棒策略。该框架利用无监督学习算法将示范动作序列聚集到不同的人类类型中,并使用逆强化学习算法学习代表每种类型的奖励函数。最后,该方法得到了验证,并在实验室中演示了同一个人类与小型工业机器人配合完成任务的可能性。
该研究提出了一个利用无人干预的关节行动示范学习人类用户模型的框架,以便机器人能够计算出一项与人类的合作任务相适应的鲁棒策略。该方法通过无监督学习算法将示范动作序列聚集到不同的人类类型中,并使用逆强化学习算法学习代表每种类型的奖励函数。实验室中的演示验证了该方法,展示了同一个人类与小型工业机器人配合完成任务的可能性。
本研究提出了一种多智能体协调的方法,将信息整合到公共操作图中并传播,能够在分布不均的初始状态下产生鲁棒的策略。
完成下面两步后,将自动完成登录并继续当前操作。