小红花·文摘

本文介绍了“文兰”项目的研究进展，重点在于通过BriVL模型和跨模态对比学习实现多模态预训练。团队建立了中文多源图像文本语料库RUC-CAS-WenLan，实验结果表明BriVL在多项任务中优于UNITER和CLIP。此外，提出了多种预训练方法，如SemVLP、MVPTR和TCL，在图像-文本检索和视觉问答等任务中表现出色。

CMAL：一种新颖的跨模态关联学习框架用于视觉-语言预训练

BriefGPT - AI 论文速递 ·

本文介绍了“文兰”项目的研究方向，使用BriVL预训练模型和跨模态对比学习框架，实现大规模多模态预训练。同时，建立了中文多源图像文本语料库RUC-CAS-WenLan，用于BriVL模型的预训练。实验结果表明，BriVL模型在各种下游任务中的性能优于UNITER和OpenAI CLIP。

Ziya-VL: 多任务指导微调的双语大型视觉语言模型

BriefGPT - AI 论文速递 ·