小红花·文摘

本研究提出了多模态提示学习(MaPLe)方法，通过独立学习视觉和语言提示，提升CLIP在下游任务中的表现。同时，研究介绍了基于图混合预训练的框架和GNN提示方法，以提高节点分类和图分类的性能，并评估了在少样本情境下的应用潜力。

图神经网络能否在极弱文本监督下学习语言？

BriefGPT - AI 论文速递 ·

北京大学提出多模态提示学习方法，利用提示词教大模型理解人物交互关系，通过视觉空间线索和条件提示提高泛化能力。研究团队还提出零样本人物交互检测新框架，实验证明在未见类别上取得最佳性能，具有潜力。

北大王选所：让多模态大模型更懂人类在做什么｜ECCV 2024

量子位 ·

本文提出了一种基于多模态提示学习的方法，利用预训练的CLIP模型增强图像和文本特征的对齐度，从而提高对抗性攻击的鲁棒性。研究表明，该方法在多个数据集上表现优于现有攻击策略，具有更好的转移性和防御能力。此外，CLIP-Adapter和DCP方法在视觉分类和少样本学习中表现出色。

基于提示的对比学习的可转移对抗攻击

BriefGPT - AI 论文速递 ·

本文分析了对比学习在图像修复中的局限性，提出了新模块ConStyle，集成于U-Net结构中，提升了图像去噪、去雨和去雾等任务的性能。同时介绍了PromptIR和CAPTNet模型，通过提示学习和特征融合实现高效图像恢复，展现出优越的适应性和性能。MPerceiver利用多模态提示学习，增强了图像修复的适应性和保真性。

ConStyle v2：一个强大的全方位图像修复提示器

BriefGPT - AI 论文速递 ·

本研究提出了多模态提示学习（MaPLe）方法，通过独立学习视觉和语言分支的提示，增强视觉-语言提示的耦合，从而改善CLIP模型的性能。实验结果表明，该方法在多个下游任务中表现优异，具有广泛的应用前景。

MoPE-CLIP: 结构剪枝用于高效的视觉语言模型的基于模块的剪枝错误度量

BriefGPT - AI 论文速递 ·

本研究介绍了MPerceiver，一种多模态提示学习方法，通过稳定扩散先验增强了全方位图像修复的适应性、普适性和保真性。MPerceiver使用文本和视觉提示进行修复，并通过插件细节优化模块提高修复保真性。实验证明，MPerceiver在多任务预训练和低级视觉方面表现出色。在多个实验和基准测试中，MPerceiver展现了适应性、普适性和保真性的优越性。

多模态提示感知器：全能图像恢复的适应性、普适性和保真度

BriefGPT - AI 论文速递 ·