本研究提出了一种名为ReSpec的在线过滤框架,旨在解决视频-文本数据的存储和计算挑战。该框架通过模态对齐和任务相关性实时筛选数据,提高学习效率。实验结果表明,ReSpec在多个数据集上实现了先进的零样本视频检索性能,仅需5%的数据并降低计算成本。
完成下面两步后,将自动完成登录并继续当前操作。