致敬经典:在大语言模型时代重新审视机器翻译的挑战
原文中文,约500字,阅读约需2分钟。发表于: 。神经机器翻译(NMT)的进化受到六个核心挑战的显著影响,本研究重新审视这些挑战,提供有关高级大型语言模型(LLMs)背景下其持续相关性的见解:领域不匹配、平行数据量、罕见词预测、长句翻译、注意力模型作为词对齐以及次优束搜索,我们的实证发现表明 LLMs 在主要语言的预训练阶段有效减少对平行数据的依赖,LLM 基于的翻译系统显著提高了包含大约 80 个单词的长句翻译,并且可翻译长度达 512...
神经机器翻译(NMT)面临领域不匹配、平行数据量、罕见词预测、长句翻译、注意力模型和次优束搜索等六个核心挑战。研究发现,高级大型语言模型(LLMs)在预训练阶段减少对平行数据的依赖,提高了长句翻译和文档长度。然而,领域不匹配和罕见词预测仍然是挑战。此外,LLMs在翻译任务中面临推理效率、低资源语言翻译和人对齐评估等新挑战。