通过分解和利用专家模型的偏好来提高多模态大型语言模型的可信度
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出DecompGen框架,针对多模态大型语言模型在响应评估中的不足,通过分解响应并利用专家模型自动构建偏好数据集DGPref,实验结果表明偏好学习显著提升了模型的可信度。
🎯
关键要点
- 本研究提出DecompGen框架,旨在解决多模态大型语言模型在响应评估中的不足。
- DecompGen通过将响应分解为原子验证任务,并利用专家模型自动构建偏好数据集DGPref。
- 实验结果显示,经过偏好学习的多模态大型语言模型在可信度上显著提升。
- 研究验证了DecompGen方法的有效性。
➡️