评估人工智能视频质量的基准:数据集和统一模型
原文中文,约300字,阅读约需1分钟。发表于: 。探索从主观和客观质量评估的角度系统地研究人工智能驱动的视频生成质量评估问题,构建了一个大规模生成视频质量评估数据集,并建立了一个评估现有质量评估指标的基准,最后提出了一个统一的生成视频质量评估模型,在视觉、文本和动作特性的基础上通过融合关键特性来综合准确评估人工智能生成的视频质量。
通过因果推理的新视角构建了通用的人工智能生成动作数据集GAIA,用于评估文本到视频模型的动作生成能力。结果显示传统动作质量评估方法与人类意见相关性较低,揭示了当前模型与人类在AI生成视频中对动作感知的差距。强调了动作质量作为研究AI生成视频的重要视角,并促进了动作质量评估方法的发展。