该研究探讨了多种视频检索技术,包括基于神经网络的文本视觉语义嵌入、查询扩展系统和多模态模型,旨在提高视频检索性能。提出的M2-RAAP方法在减少数据量和时间消耗的同时,显著提升了检索效果。
完成下面两步后,将自动完成登录并继续当前操作。