小红花·文摘

本研究提出了“约束作为奖励”（CaR）概念，以解决机器人强化学习中奖励函数设计的复杂性。通过多个约束函数制定任务目标，运用拉格朗日方法成功获取目标行为，从而降低了手动设计奖励函数的难度。