自我改进朝向帕累托最优:缓解多目标对齐中的偏好冲突

📝

内容提要

本研究解决了多目标对齐中基于直接偏好优化的方法所面临的偏好冲突问题。通过提出一个自我改进的直接偏好优化框架,本文实现了帕累托最优响应的生成与选择,从而有效缓解偏好冲突。实验表明,该框架在帕累托前沿的表现优于多种基线方法,具有显著的优化效果。

➡️

继续阅读