小红花·文摘

本文提出了一种基于大规模视觉-语言模型的个性化视频搜索方法，通过元学习结合共享和全局特征，提升了视频检索性能。研究表明，模型能够从少量示例中有效学习个性化视觉概念，表现优于现有技术。