解决文档级神经机器翻译中的长度偏差问题

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

研究了标签平滑对神经机器翻译中波束搜索解码的影响,发现翻译长度受到上限约束。通过修正函数恢复了标签平滑模型的无偏分布,实验证明该方法在多个任务中都有质量改进。

🎯

关键要点

  • 标签平滑在神经机器翻译中提供正则化效果,但对波束搜索解码产生长度偏差。
  • 翻译长度受到独立于输入的固定常量的隐含上限约束。
  • 通过应用修正函数恢复标签平滑模型的无偏分布,验证了理论。
  • 该校正方法在多个任务中产生一致的质量改进,波束大小为4时最高可达+0.3 BLEU,波束大小为200时可达+2.8 BLEU。
➡️

继续阅读