时间倒流:一种新颖的时间强调交叉模态视频-文本检索基准

📝

内容提要

本研究解决了现有视频-文本检索基准在评估模型能力,尤其是时间理解上的不足。提出了RTime数据集,利用反向视频创建更具挑战性的负样本,并设定了三项检索基准任务,显著提升了视频-文本检索的难度和效果。研究结果表明,RTime为推动视频-文本检索和多模态理解研究提供了新的方向。

🏷️

标签

➡️

继续阅读