小红花·文摘

通过外观优化和时间一致性，提出了一种独立发现、分割和跟踪复杂视觉场景中独立移动物体的方法。该方法在多个视频分割基准上表现出竞争力，并在多物体分割问题上优于现有模型。研究发现该模型可用作逐帧Segment Anything模型的提示。