我们发布了第五代嵌入模型jina-embeddings-v5-text,提供677M和239M参数的两个版本,支持32K上下文和四种任务特定的LoRA适配器。v5-text-small在MMTEB上得分67.0,超越其他小于1B的模型,且体积更小。该模型在多语言和英语任务中表现优异,适合内存受限的部署。
本研究提出了大规模多语言文本嵌入基准(MMTEB),涵盖500多个评估任务和250种语言。最优模型“multilingual-e5-large-instruct”以560百万参数领先,并通过新方法降低计算成本。
完成下面两步后,将自动完成登录并继续当前操作。