本研究指出视觉语言模型在抽象语言处理上的不足,提出了一种无训练的方法——抽象到具体翻译器(ACT),显著提升了文本到图像的检索性能。
研究指出视觉语言模型在抽象语言处理上的不足。
抽象术语在时尚领域数据集中广泛存在且具有重要价值。
提出了一种无训练和模型无关的方法——抽象到具体翻译器(ACT)。
ACT有效地将抽象表示转化为具体表示。
ACT显著提升了文本到图像检索任务的性能,显示出优良的泛化能力。
完成下面两步后,将自动完成登录并继续当前操作。