DEV Community ·

ECCV 2024 - 基于文本到图像扩散模型的开放词汇3D语义分割

💡 原文英文，约100词，阅读约需1分钟。

📝

内容提要

该演讲介绍了Diff2Scene，一种利用冻结的文本-图像生成模型进行开放词汇3D语义理解的方法。它无需标记的3D数据，能够有效识别3D场景中的物体、外观和位置。

🎯

🏷️

全球首个Agentic扩散模型来了：边行动边纠错，128K上下文追平自回归
扩散模型首次打通长程Agent任务
Find any commit in seconds: Commit Search comes to Azure DevOps
Great code has a long memory. The fix you shipped last quarter, the refactor ...
Cyera and Oasis: Stronger Together
The post Cyera and Oasis: Stronger Together appeared first on Sequoia Capital.
陪孩子九寨沟游学第三日
今天孩子依旧是全天课程，家长不用参加。我除了加了会儿班，还抽出时间来出去研究了一下摄影，搞了一些特殊手段拍摄。加了 cpl，nd 滤镜，做了景深包围的拍摄，还用...
处理生后事的一个月
本来无意再絮叨，但父亲去世后的一个月里我经历了很多事，才明白后事并非是人下葬后就结束，那时候才是真正的开始。
25家巨头联名的那封公开信，为什么数字员工架构师应该逐字读一遍 - 张善友
你构建的数字员工，其"大脑"的法律地位、技术形态和成本结构，刚刚被这个行业最重要的一批玩家集体确认过了。剩下的问题只是——你的架构跟上了没有