小红花·文摘

本文探讨了大型语言模型的优化方法，包括相对偏好优化（RPO）和直接偏好优化（DPO），旨在提高模型对用户偏好的理解和适应性，减少对人类反馈的依赖。研究还介绍了ContraDoc数据集，分析了不同模型在处理自相矛盾信息时的表现，发现GPT-4表现最佳但仍需改进。通过引入约束DPO和可控偏好优化，实现了AI系统的安全性与有用性的平衡。

ContraSolver: 通过解决内部偏好矛盾自我对齐语言模型

BriefGPT - AI 论文速递 ·

本文提出了一种基于蒸馏的多模态对齐模型，通过偏好调优和自动生成数据的方法解决视觉大语言模型中的幻觉问题。研究探讨了大型语言模型的偏差，提出了OPEN框架以优化用户偏好获取，并介绍了因果偏好优化（CPO）和相对偏好优化（RPO）等新方法，显著提升了模型性能和适应性。

加强多模式大型语言模型的启动式优化偏好

BriefGPT - AI 论文速递 ·