小红花·文摘

CLIP（对比性语言-图像预训练）是一种多模态视觉模型，通过CLIP Surgery方法提升了解释性和性能，在开放词汇任务中取得了显著提高。

CLIP-DINOiser: 教授 CLIP 一些 DINO 的技巧

BriefGPT - AI 论文速递 ·

该论文提出了CLIP Surgery方法，提升了CLIP模型的解释性和性能，且在多个任务中获得了显着提高，如在NUS-Wide多标签识别上得到了4.41%的平均精度提升，在Cityscapes开放词汇语义分割任务上的mIoU也超过了现有方法的8.74%。

CLIPSelf：视觉 Transformer 用于开放词汇密集预测的自我精简

BriefGPT - AI 论文速递 ·

该论文提出了一种名为CLIP Surgery的方法，可以提升多模态视觉模型CLIP的解释性和性能，而不降低性能。该方法在NUS-Wide多标签识别上获得了4.41%的平均精度提升，在Cityscapes开放词汇语义分割任务上的mIoU也超过了现有方法的8.74%。

利用基于 CLIP 的多模态方法进行艺术品分类与检索

BriefGPT - AI 论文速递 ·

该论文提出了CLIP Surgery方法，提升了CLIP模型的解释性和性能，且在多个任务中获得了显着提高，如NUS-Wide多标签识别和Cityscapes开放词汇语义分割任务。

OpenFashionCLIP：基于视觉和语言的对比学习与开源时尚数据

BriefGPT - AI 论文速递 ·

CLIP（Contrastive Language-Image Pre-training）是一种多模态视觉模型，通过CLIP Surgery方法提升了解释性和性能。在开放词汇任务中，获得了显着提高，如NUS-Wide多标签识别上的4.41%平均精度提升，Cityscapes开放词汇语义分割任务上的mIoU超过了现有方法的8.74%。

关于 CLIP 在组合逻辑推理中的潜力

BriefGPT - AI 论文速递 ·