GRACE:可解释的逆强化学习语言模型框架

GRACE:可解释的逆强化学习语言模型框架

Apple Machine Learning Research Apple Machine Learning Research ·

该论文在NeurIPS 2022的“人机协作学习研讨会”上被接受。偏好强化学习算法通过人类反馈提炼奖励函数,但仍需大量标签,实用性不足。本文展示了环境编码的有效性。

原文英文,约100词,阅读约需1分钟。
阅读原文