本研究提出了VQA2指令数据集,专注于视频质量评估的视觉问答。基于该数据集开发的VQA2系列模型在视频质量评分任务中表现优异,超越了GPT-4o,展现出良好的多功能性。
完成下面两步后,将自动完成登录并继续当前操作。