本文介绍了“文兰”项目的研究进展,重点在于通过BriVL模型和跨模态对比学习实现多模态预训练。团队建立了中文多源图像文本语料库RUC-CAS-WenLan,实验结果表明BriVL在多项任务中优于UNITER和CLIP。此外,提出了多种预训练方法,如SemVLP、MVPTR和TCL,在图像-文本检索和视觉问答等任务中表现出色。
本文介绍了“文兰”项目的研究方向,使用BriVL预训练模型和跨模态对比学习框架,实现大规模多模态预训练。同时,建立了中文多源图像文本语料库RUC-CAS-WenLan,用于BriVL模型的预训练。实验结果表明,BriVL模型在各种下游任务中的性能优于UNITER和OpenAI CLIP。
完成下面两步后,将自动完成登录并继续当前操作。