jina-embeddings-v5-text：新的小型多语言嵌入模型的最新状态

Jina AI ·

jina-embeddings-v5-text：新的小型多语言嵌入模型的最新状态

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

我们发布了第五代嵌入模型jina-embeddings-v5-text，提供677M和239M参数的两个版本，支持32K上下文和四种任务特定的LoRA适配器。v5-text-small在MMTEB上得分67.0，超越其他小于1B的模型，且体积更小。该模型在多语言和英语任务中表现优异，适合内存受限的部署。

🎯

关键要点

发布了第五代嵌入模型jina-embeddings-v5-text，提供677M和239M参数的两个版本。
v5-text-small在MMTEB上得分67.0，超越其他小于1B的模型，且体积更小。
两个模型支持32K上下文和四种任务特定的LoRA适配器。
v5-text-small在多语言和英语任务中表现优异，适合内存受限的部署。
v5-text-small在检索任务上与3.8B的jina-embeddings-v4相当，但体积小5.6倍。
v5-text-nano在239M参数下的检索质量与双倍参数的模型相当。
v5-text-small在英语任务中得分71.7，领先所有小于1B的多语言模型。
模型使用解码器架构，采用最后一个token的池化方式。
Elastic Inference Service提供了快速的生产环境使用方式。
Jina Embedding API支持按token计费，适合任务选择和批处理。
模型经过Qwen3-Embedding-4B的蒸馏训练，结合了对比损失和蒸馏损失。
训练中应用了GOR正则化，使得二进制量化几乎无损，适合内存受限的部署。
嵌入模型越来越多地作为大型系统中的工具链组件使用，推向更小的模型以适应内存限制。

❓

延伸问答

jina-embeddings-v5-text模型有哪些参数版本？

该模型提供677M和239M参数的两个版本。

v5-text-small在MMTEB上的得分是多少？

v5-text-small在MMTEB上得分67.0。

这款模型适合什么样的部署环境？

该模型适合内存受限的部署环境。

v5-text-small与v4模型相比有什么优势？

v5-text-small在检索任务上与3.8B的jina-embeddings-v4相当，但体积小5.6倍。

模型的训练方法是什么？

模型经过Qwen3-Embedding-4B的蒸馏训练，结合了对比损失和蒸馏损失。

Elastic Inference Service的作用是什么？

Elastic Inference Service提供了快速的生产环境使用方式，支持直接生成嵌入。

🏷️

继续阅读

教AI模型说“我不确定”
麻省理工学院的研究人员开发了一种新训练方法“带校准奖励的强化学习”（RLCR），该方法提高了AI模型的信心估计准确性，减少了90%的校准误差，同时保持或提...
AWS Bedrock如何塑造模型上下文协议
在最近的MCP峰会上，AWS的Luca Chang讨论了MCP协议的重要性及其在人工智能中的应用。MCP已成为连接AI模型与工具的行业标准，开发者通过多样...
使用FastAPI训练、服务和部署Scikit-learn模型
本文介绍了如何使用FastAPI训练、服务和部署Scikit-learn模型。首先，创建项目结构并安装依赖。然后，使用乳腺癌数据集训练随机森林分类器并保存...
神秘模型「大象」：仅100B拿下SOTA，Token效率超高！
蚂蚁Inclusion AI团队推出了名为「大象」的AI模型，大小仅100B，具备高效的代码生成和修复能力。实测显示，「大象」在处理代码、会议纪要和数据分...
Anthropic最危险的AI模型刚刚落入错误之手
Anthropic的Mythos AI模型被一小组未经授权的用户访问，该小组利用第三方承包商的访问权限和网络侦查工具进入了该模型。Anthropic正在调...
国产多模态Agent拿下医学分割SOTA！不用改模型、不加token
浙江大学和上海人工智能实验室提出的IBISAgent框架，将医学图像分割重新定义为多步视觉决策过程，克服了现有方法的局限。通过冷启动和强化学习，IBISA...