vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
💡
原文中文,约5800字,阅读约需14分钟。
📝
内容提要
vivo发布了BlueLM-2.5-3B多模态模型,具备高效的GUI理解能力,支持长短思考模式和思考预算控制。在20项评测中表现优异,优化了训练策略和数据利用效率,显著降低了成本。该模型在文本和多模态任务上领先同规模模型,展现出强大的推理能力。
🎯
关键要点
- vivo发布了BlueLM-2.5-3B多模态模型,具备高效的GUI理解能力。
- 模型支持长短思考模式自由切换,并引入思考预算控制机制。
- BlueLM-2.5-3B在20项评测中表现优异,优化了训练策略和数据利用效率。
- 该模型在文本和多模态任务上领先同规模模型,展现出强大的推理能力。
- BlueLM-2.5-3B在文本任务上与同规模模型效果相近,缓解了能力遗忘难题。
- 在多模态任务上,BlueLM-2.5-3B领先同规模模型,推理能力强。
- 模型支持文本和多模态的长短思考以及思考预算控制,提升复杂推理任务效果。
- BlueLM-2.5-3B在GUI理解能力上全面领先同规模模型。
- 模型结构紧凑,参数量仅2.9B,具有训练和推理的成本优势。
- 预训练策略分为多个阶段,提升了训练效率与稳定性。
- 高质量训练数据支持模型性能,文本和多模态预训练数据显著多于其他模型。
- 自建高性能训练平台与框架,确保训练效率和稳定性。
❓
延伸问答
BlueLM-2.5-3B模型的主要特点是什么?
BlueLM-2.5-3B模型具备高效的GUI理解能力,支持长短思考模式自由切换,并引入思考预算控制机制。
BlueLM-2.5-3B在评测中表现如何?
在20项评测中,BlueLM-2.5-3B表现优异,尤其在文本和多模态任务上领先同规模模型。
BlueLM-2.5-3B如何优化训练策略?
该模型通过优质数据筛选、自动配比策略以及大规模推理合成数据,显著提升了训练效率与稳定性。
BlueLM-2.5-3B在多模态任务上的表现如何?
在多模态任务上,BlueLM-2.5-3B领先同规模模型,推理能力强,且与更大规模模型效果相近。
BlueLM-2.5-3B的参数量是多少?
BlueLM-2.5-3B的参数量为2.9B,具有训练和推理的成本优势。
BlueLM-2.5-3B如何解决能力遗忘问题?
通过优化数据策略和训练策略,BlueLM-2.5-3B有效缓解了多模态模型训练中的文本能力遗忘难题。
➡️