TVR-Ranking: 一份暧昧查询下的视频时刻排序检索数据集
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了一项名为RVMR的新任务,通过自然语言查询在视频中定位匹配时刻的排名列表,并开发了TVR-Ranking数据集。通过手动注释94,442个查询-时刻对,为该任务开发了评估指标,并进行了三个基准模型的实验评估。实验结果表明,RVMR任务给现有模型带来了新的挑战,该数据集对多模态搜索的研究有所贡献。
🎯
关键要点
- 介绍了一项名为RVMR的新任务,通过自然语言查询在视频中定位匹配时刻的排名列表。
- 基于TVR数据集中的原始视频和现有时刻标注开发了TVR-Ranking数据集。
- 对94,442个查询-时刻对进行了手动注释,开发了NDCG@K和IoU≥μ的评估指标。
- 进行了三个基准模型的实验评估,结果表明RVMR任务给现有模型带来了新的挑战。
- 该数据集对多模态搜索的研究有所贡献,数据集可在指定网址获取。
➡️