当前的多模态误信息检测方法存在不足,无法应对多个伪造来源的现实场景。引入了MMFakeBench作为混合来源多模态误信息的基准,通过评估6种检测方法和15个大规模视觉语言模型,结果显示当前方法在混合来源环境下表现不佳。提出了一种创新的统一框架,结合了LVLM智能体的能力,显著提高了准确性和概括能力。这项研究将推动对更真实的混合来源多模态误信息的研究,并提供公正评估。
完成下面两步后,将自动完成登录并继续当前操作。