本文提出了一种基于大规模视觉-语言模型的个性化视频搜索方法,通过元学习结合共享和全局特征,提升了视频检索性能。研究表明,模型能够从少量示例中有效学习个性化视觉概念,表现优于现有技术。
完成下面两步后,将自动完成登录并继续当前操作。