阿里发布 Babel：开放多语言大型语言模型 LLM 服务全球 90% 以上使用者

实时互动网 ·

阿里发布 Babel：开放多语言大型语言模型 LLM 服务全球 90% 以上使用者

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

阿里巴巴的Babel模型通过层扩展技术，支持25种语言，提升了低资源语言的处理能力。Babel-9B和Babel-83B在多语言任务中表现优异，尤其在推理和翻译方面，提高了训练数据有限语言的准确性。

🎯

关键要点

阿里巴巴的Babel模型通过层扩展技术，支持25种语言，提升了低资源语言的处理能力。
现有的多语言LLM模型优先考虑资源丰富的语言，导致低资源语言的处理能力不足。
Babel模型采用结构化层扩展方法，避免了传统预训练的高计算需求。
Babel-9B和Babel-83B在推理和翻译任务中表现优异，分别取得63.4和73.2的平均分。
Babel显著提高了训练数据有限语言的准确性，尤其在代表性不足的语言中表现提高了5-10%。
监督微调(SFT)模型在超过100万个对话数据集上训练，性能可与商业AI模型相媲美。
研究团队强调进一步增强可以提升Babel的功能，使其成为更强大的多语言AI工具。

❓

延伸问答

Babel模型支持哪些语言？

Babel模型支持25种语言，覆盖全球90%以上的使用者。

Babel模型如何提高低资源语言的处理能力？

Babel通过层扩展技术和优化数据质量，显著提高了低资源语言的准确性。

Babel-9B和Babel-83B的性能如何？

Babel-9B在多语言基准测试中平均得分为63.4，Babel-83B则达到73.2，表现优异。

Babel模型的训练数据来源是什么？

Babel的训练数据来自维基百科、新闻文章、教科书和多语言语料库等多个来源。

Babel模型与其他多语言模型相比有什么优势？

Babel在处理低资源语言方面表现提高了5-10%，并且在推理和翻译任务中优于其他模型。

监督微调(SFT)在Babel模型中起什么作用？

监督微调使Babel在超过100万个对话数据集上训练，提升了其在多语言讨论中的性能。

🏷️

继续阅读

重塑中国豪华汽车全球旗舰标杆，魏牌V9X重磅登陆北京车展
在2026北京国际汽车展上，魏牌发布了豪华旗舰SUV魏牌V9X，计划进军欧亚和中东市场。凭借自研能力，魏牌在高端市场取得显著成果，全球用户超过70万。V9...
海信RGB MiniLED显示屏亮相《穿普拉达的女王2》全球首映礼
海信与二十世纪影业合作，在《穿普拉达的女王2》全球首映礼上展示了其RGB MiniLED显示技术，该技术提升了色彩还原度和亮度，满足高端场景需求，强调了新...
IBM在全球范围内正式推出IBM Bob
IBM最近推出了IBM Bob，一个专为企业团队设计的AI开发伙伴，旨在提升软件开发生命周期的效率。Bob支持从规划到测试的各个阶段，具备安全控制和可审计...
为智能体可信协作提供新方案蚂蚁数科登顶以太坊全球基准评测
蚂蚁数科的零知识证明虚拟机zkDTVM在以太坊的EthProofs基准测试中将区块证明速度压缩至3.7秒，打破业界纪录，显示其区块链技术的全球领先地位。该...
阿里发布数字员工产品QoderWake，可承担工程师、运营、销售等岗位角色
阿里推出数字员工QoderWake和Qoder移动端，旨在提升工作效率。QoderWake是首个可持续进化的数字员工，能够承担多种岗位角色，并通过自我学习...
阿里云 ESA 免费 CDN 教程：全球加速 + DDoS 防护，手把手续期至 2051 年
本文介绍了阿里云ESA的免费CDN使用教程，用户可申请免费版并设置续费规则，将有效期延长至2051年。操作步骤包括进入申请页面、选择免费版、管理套餐和设置...