一键下载Meta最大视频分割数据集!含50.9K真实世界视频,覆盖47个国家

💡 原文中文,约2300字,阅读约需6分钟。
📝

内容提要

Meta开源了SAM 2模型,可以根据视频帧上的提示(点击、框选或遮罩)准确识别和分割图像或视频中的任何对象。SAM 2模型已应用于医学图像分割等多个领域。Meta还发布了用于训练SAM 2的SA-V数据集,可在HyperAI网站上下载。SA-V数据集是一个大型多样化的视频分割数据集,为未来的计算机视觉工作提供了丰富的数据资源。

🎯

关键要点

  • Meta开源了SAM 2模型,能够根据视频帧上的提示精准识别和分割图像或视频中的任何对象。

  • SAM 2模型已被应用于医学图像分割等多个领域,展现出巨大的应用潜力。

  • Meta同时发布了用于训练SAM 2的SA-V数据集,提供丰富的数据资源。

  • SA-V数据集包含50.9K个视频和642.6K个masklets,标注的masks数量是现有任何VOS数据集的53倍。

  • SA-V数据集覆盖47个国家,视频主题多样,包含室内和室外场景。

  • 研究人员确保SA-V数据集中相似对象有最小重叠,以提高数据集的有效性。

➡️

继续阅读