机器之心 ·

当视觉大模型陷入认知失调，马里兰大学构建了一个幻觉自动生成框架

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

AIxiv专栏促进学术交流，报道超过2000篇内容。马里兰大学研究团队提出AutoHallusion框架，自动生成视觉大模型的幻觉案例，以解决数据集不足的问题。实验结果显示，GPT-4V等模型在新基准数据集上的问答准确率最高为66%。该研究已发表于EMNLP 2024。

🎯

关键要点

AIxiv专栏促进学术交流，报道超过2000篇内容。
马里兰大学研究团队提出AutoHallusion框架，自动生成视觉大模型的幻觉案例。
实验结果显示，GPT-4V等模型在新基准数据集上的问答准确率最高为66%。
研究团队的共同第一作者为吴曦旸和关天瑞，研究方向涵盖强化学习和计算机视觉。
AutoHallusion框架通过插入或删除特定物体来检测大模型的幻觉现象。
该框架能够自动生成大量幻觉案例，缓解数据集不足的问题。
研究表明，插入物体的幻觉生成策略比删除物体的策略更有效。
基于物体存在性的问题更容易引发幻觉。
真实世界数据集构建的幻觉案例成功率高于合成数据集。
研究成果已发表于EMNLP 2024，论文标题为AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models。

❓

延伸问答

AutoHallusion框架的主要功能是什么？

AutoHallusion框架能够自动生成视觉大模型的幻觉案例，以检测模型在回答时可能出现的幻觉现象。

研究中提到的幻觉生成策略有哪些？

研究中提到的幻觉生成策略包括插入异常物体、插入成对物体和移除相关物体。

GPT-4V模型在新基准数据集上的问答准确率是多少？

GPT-4V模型在新基准数据集上的问答准确率最高为66%。

AutoHallusion框架如何解决数据集不足的问题？

AutoHallusion框架通过自动生成大量幻觉案例，有效缓解当前大模型幻觉研究中数据集缺乏的问题。

研究团队的共同第一作者是谁？

研究团队的共同第一作者是吴曦旸和关天瑞。

研究成果发表在哪个会议上？

研究成果已发表于EMNLP 2024。

🏷️

继续阅读

使用yii3实现一个微框架
本文介绍了如何使用 Yii3 框架构建微框架，包括创建项目目录、安装依赖、编写入口文件 index.php、配置事件监听器和路由。示例路由涵盖首页、健康检...
第28期大数据师资培训班报名主页（Hadoop+Spark+实战案例班，暑假，泉州，2026年8月6日-13日）
第28期大数据师资培训班将于2026年8月在泉州举行，旨在提升中国高校大数据课程的教学水平。培训内容包括课程知识体系、授课方法和实验环境搭建，帮助教师建立...
回归晨跑
作者分享了重拾晨跑的经历，探讨生物钟与运动的关系。尽管初期脚踝疼痛，晨跑改善了睡眠质量和生活节奏，恢复了阅读兴趣和工作动力。通过调整作息和锻炼，作者意识到...
有网友在谷歌搜索Codex被恶意广告欺骗带毒版直接窃取2万美元的加密货币
近期有网友在谷歌搜索Codex时被骗，损失高达2万美元的加密货币。攻击者利用谷歌商家域名创建钓鱼网站，诱导用户执行恶意安装命令，导致用户剪贴板内容被替换。...
Brave浏览器推出官方去广告版售价59.99美元(买断) 可禁用内置的各类广告功能
Brave 浏览器推出付费精简版 Origin，售价 59.99 美元，去除广告和盈利功能，支持最多 10 台设备同步。Linux 用户可免费使用，但在其...
在Vibe编码时代使OWASP前十名更具影响力
2025年OWASP前十名更新将重点从“过时组件”转向软件供应链安全，新增内存安全和“vibe编码”意识项，反映了开发者和网络应用安全领域对关键安全风险的共识。