小红花·文摘

介绍了Visual Haystacks（VHs）Benchmark，用于评估大型多模态模型（LMMs）在处理大量图像数据时的能力。发现现有的LMMs在处理大量图像时存在困难，尤其是在存在视觉干扰的情况下。介绍了名为MIRAGE的新训练范式，通过压缩编码、使用检索器和增加多图像训练数据来改善MIQA任务的性能。提出了使用Visual Haystacks框架来评估模型性能的建议。