视觉多语言:介绍 mcdse-2b
原文英文,约2000词,阅读约需8分钟。发表于: 。Today, I'm introducing a new experimental multilingual embedding model for flexible visual document retrieval. mcdse-2b-v1 (🤗) builds upon MrLight/dse-qwen2-2b-mrl-v1 and it is trained using the...
mcdse-2b-v1是一种新型多语言嵌入模型,支持灵活的视觉文档检索。它通过自然语言查询页面截图,整合表格和图像信息,省去传统OCR步骤。该模型在多语言上表现优异,支持将维度从1536缩减至256,保持高质量检索。训练数据来自24000个PDF文档,经过多次优化以适应不同的内存和速度需求。