为儿童简化翻译:基于年龄习得的迭代简化方法
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了现有神经机器翻译在用户语言水平与翻译难度匹配方面的不足,特别是针对儿童的有效理解能力。通过采用大语言模型,提出了一种替换高年龄习得词汇的简化方法,从而提高了翻译的可理解性。实验结果表明,该方法在保持高BLEU和COMET分数的同时,能够有效实现迭代替换,显著改善儿童对翻译内容的理解。
神经机器翻译(NMT)面临领域不匹配、平行数据量、罕见词预测、长句翻译、注意力模型和次优束搜索等六个核心挑战。LLMs在预训练阶段减少对平行数据的依赖,提高了长句翻译和文档长度。然而,领域不匹配和罕见词预测仍然是挑战。LLMs在翻译任务中面临推理效率、低资源语言翻译和人对齐评估等新挑战。