TVR-Ranking: 一份暧昧查询下的视频时刻排序检索数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了一项名为RVMR的新任务,通过自然语言查询在视频中定位匹配时刻的排名列表,并开发了TVR-Ranking数据集。通过手动注释94,442个查询-时刻对,为该任务开发了评估指标,并进行了三个基准模型的实验评估。实验结果表明,RVMR任务给现有模型带来了新的挑战,该数据集对多模态搜索的研究有所贡献。

🎯

关键要点

  • 介绍了一项名为RVMR的新任务,通过自然语言查询在视频中定位匹配时刻的排名列表。
  • 基于TVR数据集中的原始视频和现有时刻标注开发了TVR-Ranking数据集。
  • 对94,442个查询-时刻对进行了手动注释,开发了NDCG@K和IoU≥μ的评估指标。
  • 进行了三个基准模型的实验评估,结果表明RVMR任务给现有模型带来了新的挑战。
  • 该数据集对多模态搜索的研究有所贡献,数据集可在指定网址获取。
➡️

继续阅读