小红花·文摘

本文介绍了一种新的预训练框架DiffCLIP，用于减小视觉分支中的域间差异，并引入样式提示生成模块，用于少样本任务。在多个数据集上进行实验，表明DiffCLIP具有强大的3D理解能力，特别是在零样本分类方面表现出色。