小红花·文摘

本文介绍了FashionViL，一个针对时尚领域的视觉语言表征学习框架，采用多视角对比学习和伪属性分类学习等预训练任务，适用于多种视觉语言任务，并在五个下游任务中表现优异。