Dissecting the Misalignment Issues of Multimodal Large Language Models via Influence Function
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨了多模态大语言模型中的失配和误标问题,提出了一种新颖的扩展影响函数,以更准确地评估数据对模型对齐的影响,从而提升模型的透明度和可解释性。
🎯
关键要点
- 多模态大语言模型(MLLM)训练于多样且不可靠的数据来源,可能导致失配和误标问题。
- 失配和误标问题会引发模型的鲁棒性问题和幻觉现象,从而降低模型性能。
- 数据估值是一种有效的方法,用于检测和追踪这些失配现象。
- 本研究提出了一种新颖的扩展影响函数,考虑正负样本的影响,以更准确地评估数据对模型对齐的影响。
- 该方法显著提高了模型的透明度和可解释性。
➡️