ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新的奖励建模方法,旨在解决深度推理模型在低资源语言翻译中的不足。与大型推理模型相比,该方法在文学翻译中表现出色,并成功扩展至11种语言,实现了90个翻译方向的优异性能。
🎯
关键要点
- 本研究提出了一种新的奖励建模方法,旨在解决深度推理模型在低资源语言翻译中的不足。
- 该方法通过与大型推理模型进行比较,量化翻译结果并提供相应奖励。
- 实验结果表明,该方法在文学翻译中达到了新的最先进性能。
- 该方法成功扩展至11种语言,实现了90个翻译方向的优异性能。
➡️