北大开源首个针对视频编辑的新指标,与人类感知高度对齐|AAAI25
💡
原文中文,约3100字,阅读约需8分钟。
📝
内容提要
北京大学MMCAL团队开发了首个视频编辑质量评估指标VE-Bench,专注于编辑结果与原始视频的语义相关性。该指标通过丰富的数据集和创新的测试方法,提供了更符合人类感知的评价标准,并已被AAAI 2025会议录用。
🎯
关键要点
- 北京大学MMCAL团队开发了首个视频编辑质量评估指标VE-Bench。
- VE-Bench专注于编辑结果与原始视频的语义相关性。
- 该指标通过丰富的数据集和创新的测试方法,提供了更符合人类感知的评价标准。
- VE-Bench DB包含来自真实世界场景、CG渲染内容和AIGC视频的数据。
- 提示词分为风格编辑、语义编辑和结构编辑三大类别。
- VE-Bench选取了8种视频编辑方法进行评估。
- 主观实验由24位受试者进行打分,符合ITU标准。
- VE-Bench QA从文本-视频一致性、源视频-编辑后视频动态相关性和视觉质量三个维度进行评估。
- 实验结果显示,VE-Bench QA在多个数据集上的预测结果领先于其他方法。
- 相关论文已被AAAI 2025会议录用。
❓
延伸问答
VE-Bench指标的主要功能是什么?
VE-Bench指标主要用于评估视频编辑质量,关注编辑结果与原始视频的语义相关性。
VE-Bench是如何构建其数据库的?
VE-Bench DB通过收集真实世界场景、CG渲染内容和AIGC视频,确保数据多样性。
VE-Bench QA的评估维度有哪些?
VE-Bench QA从文本-视频一致性、源视频与编辑后视频动态相关性和视觉质量三个维度进行评估。
VE-Bench在视频编辑领域的创新之处是什么?
VE-Bench通过创新的测试方法和丰富的数据集,提供了更符合人类感知的评价标准。
VE-Bench的主观实验是如何进行的?
主观实验由24位受试者进行打分,符合ITU标准,评估文本与视频一致性等多个方面。
VE-Bench的实验结果与其他方法相比如何?
实验结果显示,VE-Bench QA在多个数据集上的预测结果领先于其他视频质量评价方法。
➡️