The Keyword ·

TranslateGemma：一套新的开放翻译模型

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

Gemma是新推出的开放翻译模型，支持55种语言，提供三种参数规模（4B、12B和27B）。其12B模型在翻译质量上超越27B，效率显著提升，适合移动设备和本地开发。经过两阶段微调，确保高质量翻译，推动语言交流。

🎯

关键要点

TranslateGemma是新推出的开放翻译模型，支持55种语言，提供4B、12B和27B三种参数规模。
12B模型在翻译质量上超越27B模型，效率显著提升，适合移动设备和本地开发。
经过两阶段微调，确保高质量翻译，推动语言交流。
TranslateGemma在WMT24++基准测试中表现出色，12B模型使用的参数不到基线模型的一半。
4B模型的性能与12B基线相当，适合移动推理。
使用监督微调和强化学习的两阶段微调过程，提升翻译质量。
TranslateGemma经过严格训练，确保在主要语言和低资源语言中表现可靠。
模型具备强大的多模态能力，能够在图像中翻译文本。
TranslateGemma适用于多种部署环境，提供不同规模的模型以满足需求。
研究人员和开发者可以通过技术报告、Kaggle和Hugging Face等平台尝试TranslateGemma。

❓

延伸问答

TranslateGemma支持多少种语言？

TranslateGemma支持55种语言。

TranslateGemma的模型参数规模有哪些？

TranslateGemma提供4B、12B和27B三种参数规模。

12B模型与27B模型相比有什么优势？

12B模型在翻译质量上超越27B模型，并且效率显著提升。

TranslateGemma是如何确保翻译质量的？

TranslateGemma通过两阶段微调过程，包括监督微调和强化学习，确保高质量翻译。

TranslateGemma适合在哪些设备上使用？

TranslateGemma适合移动设备、消费级笔记本电脑和云端高性能计算环境。

如何尝试使用TranslateGemma？

可以通过阅读技术报告、在Kaggle和Hugging Face下载，或通过Gemma Cookbook进行探索。

🏷️

继续阅读

介绍Gemma 4 12B：一个统一的无编码多模态模型
Gemma 4 12B是最新的多模态智能模型，专为笔记本电脑设计，具备强大的推理能力和音频输入。它采用无编码架构，减少延迟和内存使用，支持在16GB内存的...
Kakapo：使用 Wails v3、Go 和 Echo 构建一个本地翻译工作台
Kakapo 是一款基于 Wails v3 和 Go 的桌面翻译工具，整合多个 OpenAI 兼容模型，提供翻译、比较和历史记录功能。它解决了传统翻译工具...
[显示BUG没重置] Codex已重置本周使用限额原因似乎与部分模型出现的故障有关
本周，OpenAI的Codex、ChatGPT和API出现故障，导致用户使用受限。Codex团队已重置所有付费用户的使用限额，并延长7天。故障原因与部分模...
语音增强中的自监督学习：从无配对训练到基础模型先验
语音增强（SE）面临数据、目标和任务等挑战，自监督学习（SSL）逐渐成为解决方案。SSL通过未配对数据学习和生成式方法，重塑了SE的训练目标。研究表明，S...
麻省理工学院研究人员教AI模型解读图表
MIT和IBM研究人员开发了ChartNet数据集，包含超过一百万种多样化图表，旨在提升视觉语言模型对图表的理解能力。该数据集通过合成数据生成，帮助小型企...
谷歌希望向Google Play应用开发者付费购买开发者的应用源代码用于训练模型
谷歌希望向 Google Play 开发者付费，以获取应用程序代码库的访问权，旨在利用这些优质代码训练其人工智能模型 Gemini。开发者将保留100%的...