SAM 2:图像和视频中的分段洞察
原文中文,约500字,阅读约需2分钟。发表于: 。我们提出了 Segment Anything Model 2(简称 SAM 2),这是一个解决图像和视频中可提示的视觉分割的基础模型。我们构建了一个数据引擎,通过用户交互来改进模型和数据,以收集到目前为止最大的视频分割数据集。我们的模型是一个简单的 Transformer 架构,具有流式存储器,用于实时视频处理。我们的数据训练的 SAM 2...
我们提出了Segment Anything Model 2(SAM 2),是一个解决图像和视频中可提示的视觉分割的基础模型。SAM 2是一个简单的Transformer架构,具有流式存储器,用于实时视频处理。在广泛的任务中,SAM 2表现出强大的性能,使用3倍少的交互获得更好的准确性。在图像分割中,SAM 2比Segment Anything Model(SAM)更准确且速度快6倍。将发布模型的一个版本、数据集和一个交互式演示。