通过敏感度感知强化学习改善机器人运动策略的泛化能力
📝
内容提要
本研究针对强化学习在机器人领域中需要大量训练数据的难题,提出了一种将敏感度感知优化引入基于梯度的强化学习算法的新方法。实验结果表明,该方法能够显著提高在接触丰富环境中的策略鲁棒性,同时保持样本效率,进而在模拟和现实世界之间的有效转化中具有潜在的重要影响。
🏷️
标签
➡️