多模态大型语言模型(MLLMs)在处理欺骗性信息时仍存在挑战。为评估其脆弱性,提出了MAD-Bench基准,包含1000个测试样本,分析多种模型表现。GPT-4o的准确率为82.82%,而其他模型仅为9%至50%。建议在欺骗性提示中增加段落以提高准确率,但整体表现仍不理想。希望MAD-Bench能促进进一步研究。
完成下面两步后,将自动完成登录并继续当前操作。