本文介绍了一种新的预训练框架DiffCLIP,用于减小视觉分支中的域间差异,并引入样式提示生成模块,用于少样本任务。在多个数据集上进行实验,表明DiffCLIP具有强大的3D理解能力,特别是在零样本分类方面表现出色。
完成下面两步后,将自动完成登录并继续当前操作。