机器之心 ·

刚刚，Meta开源「分割一切」2.0模型，视频也能分割了

💡 原文中文，约6100字，阅读约需15分钟。

📝

内容提要

Meta发布了Segment Anything Model 2 (SAM 2)，这是一个用于静态图像和动态视频的实时对象分割的统一模型。SAM 2在准确性和性能方面超过了以前的模型，交互时间减少了1/3。该模型采用了流式内存设计，适用于实时应用。Meta还发布了一个大型注释数据库SA-V，用于训练SAM 2。该模型是开源的，可用于各种应用。然而，SAM 2在跟踪具有剧烈摄像机角度变化或长期遮挡的视频中仍面临挑战。

🎯

关键要点

Meta发布了Segment Anything Model 2 (SAM 2)，用于静态图像和动态视频的实时对象分割。
SAM 2在准确性和性能方面超过了之前的模型，交互时间减少了1/3。
该模型采用流式内存设计，适用于实时应用。
Meta发布了大型注释数据库SA-V，用于训练SAM 2，包含约51,000个视频和超过600,000个masklets。
SAM 2是开源的，支持多种应用，但在剧烈摄像机角度变化或长期遮挡的视频中仍面临挑战。
SAM 2支持在视频帧中选择和细化对象，能够处理动态现实世界中的对象分割。
Meta构建了SA-V数据集，注释数量是现有视频对象分割数据集的十倍以上。
SAM 2在多个基准测试中表现优异，速度快，实时性强。
尽管SAM 2表现出色，但在拥挤场景和快速移动对象的分割上仍存在局限性。
未来需要进一步自动化数据注释过程，以提高效率。

🏷️

继续阅读

SRT 与 MOQT：低延迟视频传输对比
本文比较了两种视频传输协议：SRT 和 MOQT。SRT 是成熟的协议，提供严格的延迟控制，但在拥塞时可能导致播放不稳定。MOQT 利用 QUIC 流架构...
洪绘响度发布：测量视频LUFS工具，并支持转换视频到指定LUFS
“洪绘响度”是一款免费的软件，旨在简化视频响度（LUFS）测量。用户只需拖拽视频文件，选择响度标准，点击转换即可快速获取响度信息。目前仅支持Mac版本，W...
开源PS3模拟器项目RPCS3开发团队：求你们别用AI提交垃圾PR了
开源PS3模拟器RPCS3开发团队呼吁用户停止提交AI生成的无用代码，因其占用大量审查时间。团队将封禁未披露代码来源的账户，并强调应学习编写有效代码。
M4芯片24GB内存跑本地模型：从装不上到每秒40token的踩坑实录
在苹果M4芯片的24GB内存笔记本上，作者成功运行Qwen 3.5-9B模型，实现每秒40个token。尽管模型偶尔出错，但在代码修改和检查中表现良好，提...
告别云端大模型：本地模型才是应用软件的靠谱未来 |
文章批判开发者过度依赖云端AI，强调本地模型在应用中的重要性。通过新闻应用示例，展示如何利用苹果设备的内置模型实现快速、安全的文本摘要，避免隐私泄露和网络...
VS Code + Veo MCP：让 Copilot 调用 Google Veo 生成 1080p AI 视频
VS Code结合Veo MCP，用户可通过GitHub Copilot轻松生成1080p AI视频，无需切换窗口或学习剪辑软件。只需获取AceData ...

刚刚，Meta开源「分割一切」2.0模型，视频也能分割了

内容提要

关键要点

标签

继续阅读