Quantity vs. Quality of Monolingual Source Data in Automatic Text Translation: Can It Be Too Good to Be Too Little?
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨了在自动翻译中,单语源数据的数量与质量之间的关系。实验结果表明,在低资源的英语-德语翻译任务中,优先使用高质量且与测试数据相关的单语数据比使用所有可用数据更有效,数据质量显著提升翻译模型的表现。
🎯
关键要点
- 本研究探讨了单语源数据的数量与质量在自动翻译中的关系。
- 实验结果显示,在低资源的英语-德语翻译任务中,优先使用高质量且与测试数据相关的单语数据更有效。
- 数据质量显著提升翻译模型的表现,优于单纯依赖数量。
- 研究提出了一种新的视角,强调高质量数据的重要性。
➡️