小红花·文摘

该研究提出了一种新型非对抗性逆强化学习算法，解决了传统方法的高计算成本和不稳定性问题。通过后继特征与奖励向量的内积实现回报的线性分解，能够与现有算法结合，并在多个控制任务中表现出色。