Apple Machine Learning Research ·

通过用户写作样本预测偏好来对齐LLM

💡 原文英文，约200词，阅读约需1分钟。

📝

内容提要

本文介绍了PROSE，一种通过用户写作样本提升偏好描述精确度的方法。PROSE通过迭代优化和多样本验证，增强了LLM代理对人类偏好的理解，写作质量比现有方法CIPHER提高了33%。结合ICL，效果再提升9%。

🎯

🔎

在创建对齐的LLM代理时，理解和满足人类偏好至关重要。传统方法往往无法捕捉个体的独特性，导致生成的内容缺乏个性化。PROSE通过用户写作样本的迭代优化，能够更精准地反映用户的真实需求，从而提升交互的有效性。

PROSE方法的核心在于其迭代优化和多样本验证机制。这种设计使得偏好推断更加准确，尤其在总结和电子邮件写作任务中表现突出。与现有方法CIPHER相比，PROSE的写作质量提高了33%，显示出其在实际应用中的优势。

ICL和PROSE的结合使用能够显著提升偏好推断的效果。研究表明，单独使用ICL时的效果有限，而与PROSE结合后，效果提升可达9%。这一发现提示开发者在设计LLM代理时，考虑多种方法的组合以优化性能。

❓

PROSE方法旨在通过用户写作样本提升偏好描述的精确度。

PROSE的写作质量比现有方法CIPHER提高了33%。

PROSE包含迭代优化推断的偏好和多样本验证推断的偏好两个关键要素。

PROSE在多个LLM上进行评估，主要通过总结和电子邮件写作任务来验证其效果。

ICL和PROSE是互补的方法，结合使用可比单独使用ICL提高9%。

满足人类偏好对于创建对齐的LLM代理至关重要，以提供个性化和有效的互动。

🏷️