两周前,我们发布了jina-embeddings-v4的GGUF格式,以提高推理速度。现代嵌入模型与LLM几乎相同,主要区别在于输出类型。文章讨论了将现代嵌入模型适配GGUF格式的经验,包括去除视觉变换器和多向量投影器,最终得到三个任务特定的GGUF模型。
传统计算机视觉模型模仿人类视觉,而jina-embeddings-v4结合图像和文本处理,解析复杂视觉材料如信息图和表格。该模型强调图像分辨率对信息提取的重要性,适当的分辨率能提升检索效果。使用多种分辨率的嵌入方法能更有效处理视觉丰富的文档。
今天发布的jina-embeddings-v4是一个包含38亿参数的通用嵌入模型,支持文本和图像处理,特别在视觉内容检索方面表现优异,超越了主要竞争对手的闭源模型。该模型支持单向量和多向量嵌入,提升了检索性能。
完成下面两步后,将自动完成登录并继续当前操作。