量子位 ·

谢赛宁盛赞字节Seed新研究！单Transformer搞定任意视图3D重建

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

字节Seed的康炳易团队推出Depth Anything 3（DA3），该模型利用单一Transformer实现任意视图的3D重建，提升了相机定位和几何重建的准确性。通过简化架构和核心预测，DA3能够从单图、多图或视频中提取深度和光线信息，展现出强大的性能和广泛的应用潜力。

🎯

关键要点

字节Seed的康炳易团队推出Depth Anything 3（DA3），利用单一Transformer实现任意视图的3D重建。
DA3在相机定位精度上平均提升35.7%，几何重建准确率提高23.6%。
DA3的架构设计简单，核心预测仅关注深度和光线信息。
模型通过单视角自注意力和跨视角自注意力机制，自动关联不同输入形式的信息。
采用师生蒸馏策略，利用高质量伪标签降低对高精度标注数据的依赖。
字节团队搭建了新的视觉几何基准，整合多个数据集全面评测模型性能。
DA3能够生成高质量的3D点云，并在虚拟漫游和数字孪生等场景中展现潜力。
康炳易是Depth Anything 3项目的带队人，专注于计算机视觉和多模态模型的研究。

🏷️

继续阅读

Installing OpenClaw 2026.3.24 Preview Version on Your Computer Using Docker
本文介绍了如何使用Docker安装OpenClaw 2026.3.24版本，包括克隆开源项目、设置环境变量、安装步骤、配置文件位置及访问控制界面的方法。
宣布Kubescape 4.0：企业级稳定性迎接AI时代
Kubescape 4.0发布，增强Kubernetes安全性，提供企业级稳定性和威胁检测。新版本支持AI代理扫描集群，简化节点扫描，提升安全性，并引入K...
F5晋升为云原生计算基金会金牌会员
云原生计算基金会（CNCF）支持在公有、私有和混合云中构建和运行可扩展应用，托管Kubernetes、Prometheus等关键技术，汇聚开发者和用户，举...
GitHub Copilot从4月24日起将收集开发者使用数据用于训练和改进AI模型
GitHub 宣布自 2026 年 4 月 24 日起，将收集开发者使用 Copilot 的交互数据，包括代码片段、上下文和评论等，用于训练 AI 模型。...
小小的但有硬派味，丰田酷路泽 FJ 正式发售，约 26.7 万元
兰德酷路泽家族新成员FJ在曼谷车展亮相，强调轻快与乐趣，保留硬派基因。车身紧凑，设计灵活，提供两种前脸风格，搭载2.7升发动机，售价约26.7万元，适合多...
X/Twitter上线好友关系链回复可以强力拦截各种垃圾账号在评论区发广告
社交媒体平台X/Twitter推出好友关系链回复功能，用户可设置仅允许关注的人及其关注的人回复，以有效拦截垃圾广告和机器人评论。该功能有助于减少垃圾账号，...

谢赛宁盛赞字节Seed新研究！单Transformer搞定任意视图3D重建

内容提要

关键要点

标签

继续阅读