小红花·文摘

本文介绍了一种名为PerSAM的个性化方法，无需训练，通过位置先验定位目标概念，然后通过目标引导注意力、目标语义提示和级联后处理在其他图像或视频中对其进行分割。此外，还提出了一种高效的单次微调变体PerSAM-F，以缓解掩模的歧义。通过在具有竞争性性能的视频对象分割上测试，验证了该方法的有效性。