ActiView: Evaluating the Active Perception Capabilities of Multimodal Large Language Models
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究介绍了一种名为ActiView的新工具,用于评估多模态大型语言模型的主动感知能力。结果显示,这些模型在同时处理多张图像时存在明显不足,需加强研究。
🎯
关键要点
-
本研究提出了一种新的基准测试工具ActiView。
-
ActiView用于评估多模态大型语言模型的主动感知能力。
-
研究发现MLLMs在同时处理多张图像时存在明显不足。
-
强调需要加强对多模态大型语言模型主动感知能力的研究。
🏷️