稳定扩散对三维场景了解多少?
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新的预训练框架DiffCLIP,用于减小视觉分支中的域间差异,并引入样式提示生成模块,用于少样本任务。在多个数据集上进行实验,表明DiffCLIP具有强大的3D理解能力,特别是在零样本分类方面表现出色。
🎯
关键要点
- 提出了一种新的预训练框架DiffCLIP,结合稳定扩散和ControlNet。
- DiffCLIP旨在减小视觉分支中的域间差异。
- 引入样式提示生成模块,用于少样本任务。
- 在ModelNet10、ModelNet40和ScanObjectNN数据集上进行广泛实验。
- DiffCLIP展现出强大的3D理解能力,特别是在零样本分类方面。
- 在ScanObjectNN的OBJ_BG数据集上实现了43.2%的零样本分类精度,达到最先进的技术水平。
- 在ModelNet10上实现了80.6%的零样本分类精度,与最先进的技术水平相当。
➡️