被注意力背叛:一种简洁而有效的自监督视频对象分割方法
我们提出了一个简单而有效的方法来进行自监督视频对象分割。利用DINO预训练的Transformer中的固有结构依赖性建立视频中的时空对应关系,并通过简单的聚类产生分割结果。我们的方法在多个无监督VOS基准测试中展示了最先进的性能。
原文中文,约400字,阅读约需1分钟。
我们提出了一个简单而有效的方法来进行自监督视频对象分割。利用DINO预训练的Transformer中的固有结构依赖性建立视频中的时空对应关系,并通过简单的聚类产生分割结果。我们的方法在多个无监督VOS基准测试中展示了最先进的性能。