本文介绍了视频对象分割(VOS)领域的研究进展,包括基于大规模数据集的序列-序列网络、RVOS与VOS模型的结合,以及新提出的Segment Anything Model 2(SAM 2)。研究表明,SAM 2在多个挑战性数据集上表现优异,有效解决了物体遮挡和跟踪问题,推动了VOS技术的发展。
本研究提出了一种名为OnlineRefer的在线模型,通过视频目标分割的方法改进了引用预测的准确性和便捷性。OnlineRefer在四个基准测试中取得了优异成绩。
该研究提出了一种基于Transformer架构的模型,通过新设计的CMA模块在少样本上构建多模态亲和力,解决了少样本的视频目标指代分割问题,并在实验中取得了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。