CLIP是一种神经网络,通过自然语言监督高效学习视觉概念,能够在任何视觉分类基准上应用,只需提供视觉类别名称,具备类似于GPT-2和GPT-3的“零样本”能力。
完成下面两步后,将自动完成登录并继续当前操作。