本文介绍了FashionViL,一个针对时尚领域的视觉语言表征学习框架,采用多视角对比学习和伪属性分类学习等预训练任务,适用于多种视觉语言任务,并在五个下游任务中表现优异。
完成下面两步后,将自动完成登录并继续当前操作。