本文提出了一种新的多目标深度强化学习方法,用于优化协作式人机拣货系统中拣货员分配给自主移动机器人的问题。该方法通过图模型和神经网络架构提高了拣货效率和工作负载公平性。实验结果表明,该方法在公平性和效率目标之间取得了良好的权衡,并且在不同仓库大小的场景中具有良好的可迁移性。
本文提出了一种新颖的多目标深度强化学习方法,用于优化拣货员分配给自主移动机器人的问题。该方法通过图模型和神经网络架构提高拣货效率和工作负载公平性。实验结果表明,该方法在公平性和效率目标之间找到了良好的权衡,并在不同仓库大小的场景中展现出良好的可迁移性。
完成下面两步后,将自动完成登录并继续当前操作。