本研究探讨了CLIP网络中单词图片和自然图片的表征,发现图像编码器可以匹配描述相符的自然图片。同时,提出了一种有效的方法来排除拼写能力,并在检索任务和生成图片方面进行了验证。
完成下面两步后,将自动完成登录并继续当前操作。