小红花·文摘

本研究提出了一种潜在偏好编码（LPC）方法，以解决大型语言模型与人类偏好对齐的问题。LPC超越了传统的奖励函数，能够自动推断数据中的隐性因素。实验结果表明，LPC在多个基准测试中优于现有算法，并增强了对噪声数据的鲁棒性。