通过外观优化和时间一致性,提出了一种独立发现、分割和跟踪复杂视觉场景中独立移动物体的方法。该方法在多个视频分割基准上表现出竞争力,并在多物体分割问题上优于现有模型。研究发现该模型可用作逐帧Segment Anything模型的提示。
完成下面两步后,将自动完成登录并继续当前操作。