本研究探讨了多语言自动后编辑系统在提升低资源印欧语言(如英语-马拉地语和英语-印地语)机器翻译质量方面的潜力。通过生成APE三元组和采用多任务学习框架,结果表明该方法在多个指标上优于单对模型,推动了低资源语言翻译的发展。
本文介绍了一种个性化自动后编辑框架,结合大型语言模型(LLMs)和对比优选优化(CPO)方法,显著提升机器翻译质量。研究表明,通过用户偏好对齐和反馈机制,可以有效减少编辑成本并提高翻译准确性。
自动后编辑(APE)是自动识别和校正机器翻译(MT)输出中的错误的任务。研究者提出了修复-过滤-使用的方法,使用APE系统校正MT训练数据的目标端错误。通过使用过滤后的语料库进行训练,相对于基线模型,英语-马拉地语和马拉地语-英语机器翻译系统性能提升了5.64和9.91个BLEU点。这项工作不受语言特征限制,是语言对不可知的。
完成下面两步后,将自动完成登录并继续当前操作。