TVR-Ranking: 一份暧昧查询下的视频时刻排序检索数据集
原文中文,约400字,阅读约需1分钟。发表于: 。本文介绍了一种名为 RVMR 的任务,通过自然语言查询在一系列视频中定位匹配时刻的排名列表,并基于 TVR 数据集中的原始视频和现有时刻标注开发了 TVR-Ranking 数据集。我们通过对 94,442 个查询 - 时刻对进行了关联级别的手动注释,为这项新任务开发了 NDCG@K,IoU≥μ 的评估指标,并进行了三个基准模型的实验评估。我们的实验证明,新的 RVMR...
本文介绍了一项名为RVMR的新任务,通过自然语言查询在视频中定位匹配时刻的排名列表,并开发了TVR-Ranking数据集。通过手动注释94,442个查询-时刻对,为该任务开发了评估指标,并进行了三个基准模型的实验评估。实验结果表明,RVMR任务给现有模型带来了新的挑战,该数据集对多模态搜索的研究有所贡献。