本研究介绍了一种名为ActiView的新工具,用于评估多模态大型语言模型的主动感知能力。结果显示,这些模型在同时处理多张图像时存在明显不足,需加强研究。
本研究提出了一种新的基准测试工具ActiView。
ActiView用于评估多模态大型语言模型的主动感知能力。
研究发现MLLMs在同时处理多张图像时存在明显不足。
强调需要加强对多模态大型语言模型主动感知能力的研究。
完成下面两步后,将自动完成登录并继续当前操作。