小红花·文摘

本研究提出了一种新的“分解奖励模型”（DRMs），旨在解决传统奖励模型难以捕捉复杂人类偏好的问题。DRMs通过二元比较提取偏好，并利用主成分分析进行向量表示，能够有效适应新用户，为个性化语言模型提供支持。