机器之心 ·

引入长思维链！微信基于阿里千问大模型搞出个翻译版o1

💡 原文中文，约3400字，阅读约需8分钟。

📝

内容提要

类o1模型通过长思维链提升机器翻译效果。微信AI团队提出DRT-o1，利用多智能体框架进行文学翻译，成功生成长思考样本，实验结果显示其翻译质量优于传统模型。

🎯

🔎

长思维链在机器翻译中的应用并非适用于所有场景。对于简单表达，直译通常足够，而复杂的文学翻译则需要长思考能力来处理明喻和隐喻。这一差异提示我们在选择翻译方法时需考虑文本的复杂性，以提高翻译质量。

DRT-o1采用的多智能体框架通过翻译者、顾问和评估者的协作，形成了一个迭代的翻译过程。这种方法不仅提高了翻译的准确性，还能在每次迭代中不断优化结果，展示了机器翻译在处理复杂文本时的潜力。

实验结果显示，DRT-o1在文学翻译上优于传统模型，尤其是在BLEU和CometScore等指标上。这表明长思维链的引入显著提升了机器翻译的质量，未来可能推动更多基于长思考的翻译技术的发展。

❓

DRT-o1模型通过引入长思维链和多智能体框架，提升了机器翻译的质量，特别是在文学翻译中处理明喻和隐喻的能力。

长思维链帮助机器翻译系统探索和反思翻译过程，从而生成更准确的翻译，尤其适用于复杂表达。

多智能体框架包括翻译者、顾问和评估者，三者通过迭代过程协作生成翻译，顾问提供反馈，评估者进行评分。

实验结果显示，DRT-o1在文学翻译上优于传统模型，DRT-o1-14B在所有指标上表现最佳。

研究者从古腾堡计划中挖掘文学句子，筛选出含有明喻或隐喻的句子，并通过多智能体框架进行长思考翻译。

训练数据通过收集需要长思考的句子，利用多智能体框架进行翻译合成，并改进可读性和流畅性而构建。

🏷️