本研究提出了一种能量基础的主动开放集标注框架(EAOA),通过自适应采样策略有效整合认知与随机不确定性,提升查询精度和模型性能,优于现有方法。
本文提出了TV-ProxyNet框架,解决了文本视频检索中模态差异的问题。通过将1对N关系转化为N个1对1关系,提高了查询精度和覆盖范围。实验结果显示,该方法在MSRVTT和ActivityNet Captions数据集上表现出色,改善了语义映射并减少了错误。
完成下面两步后,将自动完成登录并继续当前操作。