小红花·文摘 - 小红花技术领袖俱乐部

个性化群体相对策略优化用于异质偏好对齐

个性化群体相对策略优化用于异质偏好对齐

Apple Machine Learning Research ·

本研究提出了一种基于21个偏好类别的标准，能够捕捉超过89%的个体偏好变化，强调其在模型评估和训练中的实用性，并提供了对模型对齐的深入见解。

A Standard Framework for Learning Human Preferences from Binary Ratings

BriefGPT - AI 论文速递 ·

本研究探讨了集体决策中个体偏好的有效代表问题。研究表明，经过微调的大型语言模型能够在多样化人群中有效寻找共识，提供数字代表的新模型。

Language Agents as Digital Representatives in Collective Decision-Making

BriefGPT - AI 论文速递 ·