实时互动网 ·

Unbabel 推出 TOWER+：多语言 LLM 高保真翻译与指令遵循的统一框架

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

大语言模型（LLM）推动了机器翻译的发展，但在翻译准确性与指令遵循之间存在挑战。TOWER+模型通过预训练和强化学习实现了翻译与对话能力的平衡，展现出优越的翻译质量和灵活性，适用于多种应用场景。

🎯

🔎

TOWER+模型通过预训练和强化学习实现了翻译准确性与指令遵循之间的平衡。这一特性使其在多种应用场景中表现出色，尤其是在需要同时处理翻译和对话任务的情况下。企业在选择翻译工具时，应关注模型在这两方面的综合表现，以确保满足特定需求。

TOWER+模型支持多达55种语言和方言，展现出其在全球化背景下的适用性。这种多语言能力不仅提升了翻译质量，也为跨国企业提供了更灵活的沟通解决方案。企业在国际化过程中，选择具备广泛语言支持的模型，可以有效降低沟通障碍，提升工作效率。

TOWER+在多个基准测试中取得了优异成绩，尤其是在翻译保真度和指令遵循能力方面。这些测试结果不仅验证了模型的性能，也为用户提供了选择依据。企业在评估翻译工具时，应重视这些基准测试数据，以确保所选工具能够满足其业务需求。

❓

TOWER+模型通过预训练和强化学习实现翻译与对话能力的平衡，涵盖多种语言和方言，展现出优越的翻译质量和灵活性。

TOWER+模型通过统一的训练流程，包括预训练、监督调优和强化学习，来平衡翻译准确性与指令遵循能力。

TOWER+的训练流程包括持续预训练、监督微调、偏好优化和可验证强化学习四个阶段。

TOWER+模型在多语言通用聊天提示中取得了33.47%的胜率，并在多个基准测试中表现优于同等规模的开放权重模型。

TOWER+模型有多个参数规模的变体，包括20亿、90亿和720亿参数。

TOWER+模型适用于翻译、代码生成、数学问题求解和问答系统等多种应用场景。

🏷️