本研究提出了一种“奖励训练辅助”(RTW)方法,旨在解决机器人强化学习中的辅助奖励问题。RTW能够动态调整奖励权重,显著提高导航成功率和越野性能,训练效率提升35%至3倍,验证了其有效性。
完成下面两步后,将自动完成登录并继续当前操作。