2024 年 CVPR PVUW Workshop MeViS 赛道第二名方案:基于运动表情引导的视频分割
原文中文,约300字,阅读约需1分钟。发表于: 。基于 RVOS 方法,我们利用从视频实例分割模型获取的掩膜信息作为临时信息进行时间增强,并采用 SAM 进行空间细化,最终在验证阶段取得了 49.92 J &F 的得分,在测试阶段取得了 54.20 J &F 的得分,在 2024 CVPR PVUW 挑战赛的 MeViS 轨道中获得了第 2 名的最终排名。
本研究提出了名为MeViS的大规模数据集,用于指示复杂环境中的目标对象,并分析了现有方法在运动表达引导的视频分割中的挑战。研究还提出了一个基准方法,旨在开发利用运动表达作为主要线索的有效语言引导视频分割算法。MeViS数据集已发布。