BriefGPT - AI 论文速递 ·

为多模态大型语言模型自动生成视觉幻觉测试用例

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文介绍了M-HalDetect数据集及其在幻觉检测中的应用，分析了大型语言模型（LLM）在视觉问题回答中的幻觉问题。研究表明，现有模型在负面代词上的准确率低于10%，并提出了多种方法和数据集以减少幻觉现象，提升模型的鲁棒性和可靠性。

🎯

🔎

随着大型语言模型在各领域的广泛应用，幻觉问题的存在可能导致错误信息的传播。因此，开发有效的幻觉检测工具和数据集，如M-HalDetect，显得尤为重要。这不仅能提升模型的可靠性，还能增强用户对AI系统的信任。

多模态大型语言模型在处理视觉信息时面临独特的挑战，尤其是在负面代词的理解上准确率低于10%。这表明，模型在理解复杂语境和视觉信息的结合时仍存在显著不足，未来的研究需聚焦于提升其在这些领域的表现。

通过AutoDebug框架生成的对抗攻击示例，研究者能够深入分析大型语言模型的幻觉行为。这种方法不仅有助于识别模型的弱点，还为改进模型的鲁棒性提供了新的思路，推动了幻觉问题的解决进程。

❓

M-HalDetect数据集用于训练和评估幻觉检测和预防模型。

使用Fine-grained Direct Preference Optimization和拒绝抽样方法可以成功减少幻觉率。

NOPE基准用于评估视觉语言模型中的对象幻觉问题，特别是负面代词的准确性。

词汇多样性、广泛的问题类型和与场景相关的对象会增加对象幻觉的风险。

VHTest工具生成了包含8种视觉幻觉模式的实例数据集。

AUTOHALLUSION基准测试方法揭示了幻觉的常见失败模式和原因，成功诱导幻觉的比例高达97.7%。

🏷️