Creative Preference Optimization
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的对齐方法——创造性偏好优化(CrPO),旨在提升大型语言模型(LLMs)生成创造性内容的能力。研究结果表明,应用CrPO后,模型在新颖性、多样性和惊喜性方面优于现有基准。
🎯
关键要点
- 本研究提出了一种新的对齐方法——创造性偏好优化(CrPO)。
- CrPO旨在提升大型语言模型(LLMs)生成创造性内容的能力。
- 研究表明,应用CrPO后,模型在新颖性、多样性和惊喜性方面优于现有基准。
- 通过模块化方式将多维度创造性信号注入偏好优化目标中,有助于提升LLMs的创造力。
➡️