我们提出了一个概念简单但有效的多语言CLIP压缩框架,训练了一个轻量级的多语言视觉-语言模型DC-CLIP,用于中文和英文环境。DC-CLIP在英文环境中性能优越,在中文环境中表现竞争性能,即使使用较少的训练数据。训练机制证明了其有效性。
完成下面两步后,将自动完成登录并继续当前操作。