强化学习在自主移动机器人充电决策中的应用:奖励与动作空间设计的影响

📝

内容提要

本研究解决了自主移动机器人在大规模堆放仓库中的充电策略优化问题。通过分析奖励和动作空间配置对代理性能的影响,本文提出了一种新颖的强化学习设计,且结果表明更灵活的RL方法在服务时间方面优于传统启发式策略,同时讨论了设计灵活性与收敛时间、稳定性之间的权衡。研究还扩展了现有的开源模拟框架,并采用了一种新的适应性基准启发式方法进行重复性评估。

➡️

继续阅读