量子位 ·

Meta「分割一切」3.0曝光！技能语义分割加入概念提示，好好玩，要爆了

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

Meta推出的SAM 3模型实现了通过语言提示在图像中识别和分割多个实例。该模型支持多模态提示，具备快速处理和高准确率，但对复杂语言的理解能力有限。

🎯

❓

SAM 3模型能够通过语言提示在图像中识别和分割多个实例。

SAM 3处理一张含100多个物体的图片仅需30ms，具备近实时处理能力。

PCS（Promptable Concept Segmentation）是指模型能够基于短语和图像示例分割匹配提示概念的实例。

在LVIS数据集的零样本分割任务中，SAM 3的准确率达到了47.0，显著高于之前的38.5。

SAM 3采用新的架构设计，解耦物体识别和定位任务，从而提高检测精度。

SAM 3在医疗图像等特定领域的泛化能力有限，且在多目标视频分割任务中性能下降。

🏷️

微软首款高级推理人工智能问世
微软在2026年Build大会上发布了多款新AI模型，旗舰模型MAI-Thinking-1是其自主开发的重要进展，表现优异，基于干净数据训练。此外，还推出...
百度文心发布 PaddleOCR-VL-1.6：准确率突破 96.33%，刷新文档解析 SOTA
百度发布的PaddleOCR-VL-1.6在OmniDocBench v1.6评测中准确率超过96.3%，综合性能全球第一，支持100多种语言，适应复杂文...
OpenAI首秀“无APP”概念机：UI实时生成，2027年冲击AI手机市场
在OpenAI Voice Hack Night活动上，开发团队展示了“Agentic操作系统”原型，该系统通过AI即时生成界面，用户可通过语音指令完成复...
2026 06 03 HackerNews
预计SpaceX、Anthropic和OpenAI的首次公开募股将成为历史上最大规模的上市事件，可能为美股市值增加约4万亿美元。Mullvad警告社交媒体...
运营一个以人工智能为核心的工程组织
工程团队在使用Claude Code后，工作流程显著变化，传统规划被即时规划取代，强调原型和用户反馈。信息收集时优先询问Claude，代码审查中Claud...
Go 生态17年大浪淘沙：2026年最值得引入的10个“神仙级”QoL工具包
2026年，Go语言生态发生重大变革，推荐10个提升开发体验的工具包，包括sqlc（类型安全数据库编译器）、chi（轻量级路由器）、pgx（Postgre...