Blog on Qwen ·

Qwen3 Embedding：新一代文本表征与排序模型

💡 原文中文，约2800字，阅读约需7分钟。

📝

内容提要

Qwen3 Embedding 系列模型正式发布，专注于文本表征与排序任务，基于 Qwen3 训练，性能卓越。支持100多种语言，提供多种参数配置，灵活满足不同需求。模型采用分阶段训练，提升泛化能力与任务适配性，未来将扩展多模态表征能力。

🎯

🔎

Qwen3 Embedding 系列模型支持超过100种语言，涵盖主流自然语言及编程语言。这种广泛的语言支持使得模型在全球范围内的应用潜力巨大，尤其适合需要处理多语言数据的企业和开发者。

该系列模型提供从0.6B到8B的多种参数配置，开发者可以根据具体需求选择合适的模型。这种灵活性不仅提高了性能，还能有效降低应用成本，适应不同场景的需求。

Qwen3 Embedding 系列采用三阶段训练架构，结合弱监督和高质量标注数据。这种方法有效提升了模型的泛化能力和任务适配性，使其在多项基准测试中表现优异，值得关注其在实际应用中的表现。

❓

Qwen3 Embedding 系列模型主要应用于文本表征、检索与排序任务。

该系列模型支持超过100种语言，包括主流自然语言和多种编程语言。

模型提供从0.6B到8B的多种参数规模配置。

模型采用三阶段训练架构，结合弱监督和高质量标注数据进行训练。

在多项基准测试中，Qwen3 Embedding 系列表现优异，尤其在多语言文本理解方面。

未来计划拓展多模态表征能力，增强跨模态语义理解。

🏷️