小红花·文摘

当前的多模态误信息检测方法存在不足，无法应对多个伪造来源的现实场景。引入了MMFakeBench作为混合来源多模态误信息的基准，通过评估6种检测方法和15个大规模视觉语言模型，结果显示当前方法在混合来源环境下表现不佳。提出了一种创新的统一框架，结合了LVLM智能体的能力，显著提高了准确性和概括能力。这项研究将推动对更真实的混合来源多模态误信息的研究，并提供公正评估。