💡 原文英文,约600词,阅读约需3分钟。
📝

内容提要

谷歌发布了基于Gemma 3架构的开源翻译模型套件TranslateGemma,支持55种语言,提供4B、12B和27B三种参数规模,适用于移动设备和云加速器。通过监督微调和强化学习,TranslateGemma在翻译质量和效率上有显著提升,尤其在低资源语言方面表现优异,受到社区的赞赏,适合成本敏感的应用场景。

🎯

关键要点

  • 谷歌发布了基于Gemma 3架构的开源翻译模型套件TranslateGemma,支持55种语言。
  • TranslateGemma提供4B、12B和27B三种参数规模,适用于移动设备和云加速器。
  • 模型通过监督微调和强化学习进行训练,显著提升翻译质量和效率,尤其在低资源语言方面表现优异。
  • 在WMT24++基准测试中,12B模型的错误率低于27B基线,4B模型接近12B基线的性能。
  • TranslateGemma还训练了近500个额外语言对,以支持社区的进一步研究和微调。
  • 不同模型的部署目标不同,4B模型适合移动和边缘推理,12B模型适合消费者笔记本,27B模型适合云部署。
  • 社区对TranslateGemma的效率和开放性表示赞赏,认为其适合成本敏感的应用场景。
  • 与其他开源翻译模型相比,TranslateGemma更专注于小模型规模下的翻译效率。
➡️

继续阅读