ProMQA: A Question-Answering Dataset for Understanding Multimodal Procedural Activities
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了新评估数据集ProMQA,包含401对多模态程序性问题及答案,解决了现有系统评估不足的问题,显示系统与人类性能存在显著差距。
🎯
关键要点
-
本研究提出了新评估数据集ProMQA,包含401对多模态程序性问题及答案。
-
该数据集解决了现有系统评估不足的问题。
-
研究显示系统与人类性能之间存在显著差距。
-
采用了人类与大语言模型联合的经济高效的标注方式。
-
研究推动了多模态理解能力的深入研究。
🏷️