小红花·文摘

本文介绍了视频对象分割（VOS）领域的研究进展，包括基于大规模数据集的序列-序列网络、RVOS与VOS模型的结合，以及新提出的Segment Anything Model 2（SAM 2）。研究表明，SAM 2在多个挑战性数据集上表现优异，有效解决了物体遮挡和跟踪问题，推动了VOS技术的发展。

LSVOS挑战报告：大规模复杂和长视频目标分割

BriefGPT - AI 论文速递 ·

Meta发布了升级版的计算机视觉模型Segment Anything Model 2 (SAM 2)，可以实时快速识别和分离图像或视频中的对象。文章提供了使用Modelbit将SAM 2模型部署为REST API的说明。SAM 2具有多个关键功能和增强，包括内存机制、流式架构、增强图像分割、多个掩码预测、遮挡预测和视频分割。文章还解释了如何以编程方式使用SAM 2为图像生成分割掩码。最后，讨论了如何使用Modelbit将SAM 2模型部署为REST API端点。

如何使用Modelbit部署Segment Anything Model 2 (SAM 2)

DEV Community ·

本研究提出了Segment Anything Model 2和Eff-UNet模型，解决了太阳能板分割在不同光照和分辨率下的问题。研究发现，在低光照条件下，Segment Anything Model 2表现明显提升；而在高分辨率图像中，Eff-UNet表现最佳，尤其在用户提示框的辅助下。该研究强调了各模型在遥感数据处理中的优势和局限性。

卫星太阳能天窗：全球太阳能映射的高分辨率数字表面模型与屋顶分割

BriefGPT - AI 论文速递 ·

Meta发布了Segment Anything Model 2 (SAM 2)，可以实时对图像和视频中的对象进行分割和跟踪。SAM 2已应用于医学成像和自动驾驶等多个领域。Meta还发布了一个名为SA-V的大规模数据集，用于训练SAM 2。该数据集包含50.9K个视频和642.6K个掩膜，为未来的计算机视觉研究提供了丰富的资源。SA-V数据集可以从HyperAI网站下载。

一键下载Meta最大视频分割数据集！含50.9K真实世界视频，覆盖47个国家

HyperAI超神经 ·

研究团队提出了Segment Anything Model 2（SAM 2），是一个用于图像和视频分割的基础模型。SAM 2是一个简单的Transformer架构，具有流式存储器，用于实时视频处理。在广泛的任务中，SAM 2表现出强大的性能，视频分割中使用3倍少的交互获得更好的准确性，图像分割中比SAM模型更准确且速度快6倍。研究团队将发布模型版本、数据集和交互式演示。

SAM2-适配器：在下游任务（伪装、阴影、医学图像分割等）中评估与适配

BriefGPT - AI 论文速递 ·

研究比较了Segment Anything Model (SAM)和Segment Anything Model 2 (SAM 2)在医学图像分割方面的性能。结果显示，虽然SAM 2在某些情况下稍好，但总体而言，SAM 2并没有超过SAM。

SAM 2在医学图像分割中的表现是否优于SAM？

BriefGPT - AI 论文速递 ·

研究团队提出了Segment Anything Model 2（SAM 2），是一个解决图像和视频中可提示的视觉分割的基础模型。SAM 2是一个简单的Transformer架构，具有流式存储器，用于实时视频处理。在广泛的任务中，SAM 2表现出强大的性能，比之前的方法使用更少的交互获得更好的准确性。研究团队相信他们的数据、模型和见解将成为视频分割和相关感知任务的重要里程碑。他们将发布模型的一个版本、数据集和一个交互式演示。

评估 Segmentation Anything Model 2：SAM2 在水下环境中的作用

BriefGPT - AI 论文速递 ·

我们提出了Segment Anything Model 2（SAM 2），是一个解决图像和视频中可提示的视觉分割的基础模型。SAM 2是一个简单的Transformer架构，具有流式存储器，用于实时视频处理。在广泛的任务中，SAM 2表现出强大的性能，使用3倍少的交互获得更好的准确性。在图像分割中，SAM 2比Segment Anything Model（SAM）更准确且速度快6倍。将发布模型的一个版本、数据集和一个交互式演示。

SAM 2：图像和视频中的分段洞察

BriefGPT - AI 论文速递 ·

刚刚，Meta开源「分割一切」2.0模型，视频也能分割了

机器之心 ·