学习动作和注意力焦点的控制与一个类似对数极坐标的传感器
原文中文,约300字,阅读约需1分钟。发表于: 。在这篇论文中,我们探讨了使用类似于对数极坐标图像数据和凝视控制来减少自主移动机器人上的图像处理时间的长期目标。我们使用经典的深度强化学习方法和 LSTM 网络扩展了 A3C 深度强化学习方法,并训练出了三个 Atari 游戏的策略和凝视控制的策略。通过将图像像素数量减少 5 倍而不降低游戏性能,我们进一步降低了图像像素的数量。
本文使用对数极坐标图像数据和凝视控制来减少自主移动机器人上的图像处理时间的长期目标。使用深度强化学习方法和LSTM网络扩展了A3C深度强化学习方法,并训练出了三个Atari游戏的策略和凝视控制的策略。通过将图像像素数量减少5倍而不降低游戏性能,进一步降低了图像像素的数量。