ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种新的奖励建模方法,旨在解决深度推理模型在低资源语言翻译中的不足。与大型推理模型相比,该方法在文学翻译中表现出色,并成功扩展至11种语言,实现了90个翻译方向的优异性能。

🎯

关键要点

  • 本研究提出了一种新的奖励建模方法,旨在解决深度推理模型在低资源语言翻译中的不足。
  • 该方法通过与大型推理模型进行比较,量化翻译结果并提供相应奖励。
  • 实验结果表明,该方法在文学翻译中达到了新的最先进性能。
  • 该方法成功扩展至11种语言,实现了90个翻译方向的优异性能。
➡️

继续阅读