Clip-Embeddings模型由krthr维护,基于clip-vit-large-patch14生成文本和图像的CLIP嵌入,主要用于图像-文本相似性匹配和多模态分析,支持文本和图像输入,输出为数字数组形式的嵌入表示。
完成下面两步后,将自动完成登录并继续当前操作。