本文探讨了神经机器翻译中的偏差问题及其在域偏移和样本干扰下的脆弱性,提出最小贝叶斯风险解码(MBR)作为解决方案。研究表明,尽管存在长度和频率偏差,MBR能够提高模型的鲁棒性,适应样本干扰和域偏移。此外,提出了一种基于模型的MBR方法(MBMBR),在多个文本生成任务中表现优于传统MBR,并通过新算法提升了解码速度和翻译质量。
本文介绍了最小贝叶斯风险(MBR)解码的方法,该方法选择具有最低风险的输出,为NLP模型提供了额外的理论依据。文章还给出了在NLP模型中应用MBR的理论和实证结果,并提出了该领域的未来方向的具体建议。
完成下面两步后,将自动完成登录并继续当前操作。