标签

 机器翻译 

相关的文章:

本列表汇集了关于机器翻译领域的最新研究,涵盖大型语言模型的应用、性别偏见评估及多模态翻译技术等前沿话题。

FuxiMT:为中国中心的多语种机器翻译稀疏化大型语言模型

本研究针对现有多语种机器翻译模型在低资源环境下的性能不足问题,提出了一种名为FuxiMT的稀疏化大型语言模型。该模型通过在大型中文语料库上进行预训练并在65种语言的平行数据集上进行多语言微调,展示出优越的翻译能力,尤其在缺乏平行数据时具有优异的零-shot 翻译能力,具有显著的实用潜力。

本研究提出FuxiMT模型,旨在提升低资源环境下的多语种机器翻译性能。该模型在大型中文语料库上预训练,并在65种语言的平行数据集上进行微调,显示出优越的翻译能力,尤其在平行数据稀缺时表现突出。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

利用单语数据改善检索增强神经机器翻译

本研究针对传统的检索增强神经机器翻译系统在利用双语语料时存在的局限,探讨了如何通过直接在目标语言中检索相关片段,来有效利用可用的单语目标语料。研究表明,通过改进的跨语言检索系统,采用句子级和词级匹配目标,显著提升了翻译性能,尤其是在目标单语资源远超平行数据的真实场景中。

发表于:
阅读原文

大型语言模型能否检测重述和机器翻译中的内在幻觉?

本研究针对大型语言模型(LLMs)常见的幻觉现象进行探讨,评估其在重述和翻译任务中的内在幻觉检测能力。通过分析不同模型在各种任务和语言中的表现,研究发现模型性能在各种任务间存在差异,但在特定提示下表现一致,且自然语言推理模型的表现同样优异,表明LLM为基础的检测方法并非唯一选择。

本研究探讨大型语言模型(LLMs)的幻觉现象,评估其在重述和翻译任务中的幻觉检测能力。结果表明,不同任务和语言下模型表现存在差异,但在特定提示下表现一致,自然语言推理模型的检测能力尤为突出,表明LLM检测方法并非唯一选择。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文
发表于:
阅读原文

DIMT25@ICDAR2025:HW-TSC的端到端文档图像机器翻译系统,利用大型视觉语言模型

本研究针对文档图像机器翻译中的复杂布局问题,提出了华为翻译服务中心的技术解决方案。通过结合多任务学习与感知链思维的训练框架,构建了一个全面的端到端翻译系统,显著提升了OCR和非OCR文档图像翻译任务的效果,展示了高效的文档翻译方法。

本研究提出了一种针对文档图像机器翻译复杂布局问题的技术解决方案,结合多任务学习与感知链思维,构建了高效的端到端翻译系统,显著提升了OCR和非OCR文档的翻译效果。

原文中文,约200字,阅读约需1分钟。发表于:
阅读原文

比较大型语言模型与传统机器翻译工具在翻译医疗咨询总结中的表现:一项初步研究

本研究解决了大型语言模型(LLMs)和传统机器翻译(MT)工具在翻译医疗咨询总结中的表现差异。研究发现,传统MT工具在复杂文本翻译中表现更佳,而LLMs在简单总结的越南语和中文翻译中展示出潜力。研究强调了在医疗翻译中需要领域特定的训练、改进的评估方法和人工监督。

本研究比较了大型语言模型(LLMs)与传统机器翻译(MT)工具在医疗咨询总结翻译中的表现。结果表明,传统MT在复杂文本翻译中更具优势,而LLMs在简单总结的越南语和中文翻译中显示出潜力。研究强调医疗翻译需要领域特定的训练和人工监督。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

FairTranslate:一种用于评估机器翻译中性别偏见的英法数据集,突破性别二元性

本研究关注大型语言模型在翻译任务中对包容性语言的处理,特别是如何评估机器翻译中的非二元性别偏见。提出的FairTranslate数据集通过2418对英法句子及其注释,揭示当前主流语言模型在性别代表性方面存在显著偏差,强调了需要采取集中策略以确保翻译系统中的公平和包容性语言使用。

本研究探讨大型语言模型在翻译任务中对包容性语言的处理,特别是非二元性别偏见。通过FairTranslate数据集,揭示主流语言模型在性别代表性方面的偏差,强调需采取策略以确保翻译系统的公平与包容性。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文

人工智能代理是机器翻译的新前沿吗?单一和多代理系统在多语言数字通信中的挑战与机遇

本研究关注人工智能代理在机器翻译中的应用潜力,特别是单一和多代理系统如何提升多语言数字通信。研究表明,多代理系统能够通过专业化协作显著提高翻译准确性和上下文理解,尤其在法律翻译中展示了优于传统机器翻译的翻译质量。这项工作为未来机器翻译领域的多代理系统研究奠定了基础。

本研究探讨了人工智能代理在机器翻译中的应用,特别是单一与多代理系统对多语言沟通的提升。结果显示,多代理系统在翻译准确性上显著优于传统机器翻译,尤其在法律翻译领域,为未来研究提供了基础。

原文中文,约200字,阅读约需1分钟。发表于:
阅读原文

既视感:通过机器翻译评估多语言大型语言模型评估

本研究解决了多语言大型语言模型(mLLMs)生成能力评估缺乏全面性和科学严谨性的问题。论文借鉴机器翻译领域的评估最佳实践,提出了一系列可操作的推荐措施,以提升mLLMs的质量评估,并确保评估方法的可靠性。研究发现,这些标准化方法有助于更好地理解不同模型之间的质量差异,对mLLMs的研究与发展具有重要影响。

本研究针对多语言大型语言模型(mLLMs)生成能力评估的不足,提出可操作的建议,借鉴机器翻译领域的最佳实践,以提高评估的质量和可靠性,推动mLLMs的研究与发展。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文
发表于:
阅读原文