本研究提出了一种“奖励训练辅助”(RTW)方法,旨在解决机器人强化学习中的辅助奖励问题。RTW能够动态调整奖励权重,显著提高导航成功率和越野性能,训练效率提升35%至3倍,验证了其有效性。
本文提出了一种基于机器人速度的新表示方法,可穿越性强。该方法可与各种规划范例结合,并在成本图中提供风险感知成本项。数值模拟表明,该方法能够更快地到达目标,并提高30%的导航成功率。
完成下面两步后,将自动完成登录并继续当前操作。