词汇重要性对机器翻译模型盗用的影响
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了解决神经机器翻译模型中大词汇表问题的方法,通过选择小目标词汇表并基于翻译模型或短语库实现。实验证明,该方法在英法翻译任务中的BLEU分数比使用大词汇表的系统高1个点。
🎯
关键要点
- 提出了一种句子级或批量级词汇表来解决神经机器翻译模型中的大词汇表问题。
- 该方法选择小目标词汇表,基于源句子中每个单词或短语的翻译选项。
- 实现方式为基于单词翻译模型或双语短语库。
- 实验结果显示,该方法在英法翻译任务中的BLEU分数比使用大词汇表的系统高1个点。
➡️