💡
原文英文,约600词,阅读约需3分钟。
📝
内容提要
谷歌发布了基于Gemma 3架构的开源翻译模型套件TranslateGemma,支持55种语言,提供4B、12B和27B三种参数规模,适用于移动设备和云加速器。通过监督微调和强化学习,TranslateGemma在翻译质量和效率上有显著提升,尤其在低资源语言方面表现优异,受到社区的赞赏,适合成本敏感的应用场景。
🎯
关键要点
- 谷歌发布了基于Gemma 3架构的开源翻译模型套件TranslateGemma,支持55种语言。
- TranslateGemma提供4B、12B和27B三种参数规模,适用于移动设备和云加速器。
- 模型通过监督微调和强化学习进行训练,显著提升翻译质量和效率,尤其在低资源语言方面表现优异。
- 在WMT24++基准测试中,12B模型的错误率低于27B基线,4B模型接近12B基线的性能。
- TranslateGemma还训练了近500个额外语言对,以支持社区的进一步研究和微调。
- 不同模型的部署目标不同,4B模型适合移动和边缘推理,12B模型适合消费者笔记本,27B模型适合云部署。
- 社区对TranslateGemma的效率和开放性表示赞赏,认为其适合成本敏感的应用场景。
- 与其他开源翻译模型相比,TranslateGemma更专注于小模型规模下的翻译效率。
➡️