小红花·文摘

本研究提出了一种“奖励训练辅助”（RTW）方法，旨在解决机器人强化学习中的辅助奖励问题。RTW能够动态调整奖励权重，显著提高导航成功率和越野性能，训练效率提升35%至3倍，验证了其有效性。