FuxiMT：为中国中心的多语种机器翻译稀疏化大型语言模型

本研究针对现有多语种机器翻译模型在低资源环境下的性能不足问题，提出了一种名为FuxiMT的稀疏化大型语言模型。该模型通过在大型中文语料库上进行预训练并在65种语言的平行数据集上进行多语言微调，展示出优越的翻译能力，尤其在缺乏平行数据时具有优异的零-shot 翻译能力，具有显著的实用潜力。

本研究提出FuxiMT模型，旨在提升低资源环境下的多语种机器翻译性能。该模型在大型中文语料库上预训练，并在65种语言的平行数据集上进行微调，显示出优越的翻译能力，尤其在平行数据稀缺时表现突出。

FuxiMT 中国低资源多语种大型语言模型平行数据机器翻译

原文中文，约300字，阅读约需1分钟。发表于：。

阅读原文

分享给好友

利用单语数据改善检索增强神经机器翻译

本研究针对传统的检索增强神经机器翻译系统在利用双语语料时存在的局限，探讨了如何通过直接在目标语言中检索相关片段，来有效利用可用的单语目标语料。研究表明，通过改进的跨语言检索系统，采用句子级和词级匹配目标，显著提升了翻译性能，尤其是在目标单语资源远超平行数据的真实场景中。

机器翻译

发表于：。

阅读原文

分享给好友

大型语言模型能否检测重述和机器翻译中的内在幻觉？

本研究针对大型语言模型（LLMs）常见的幻觉现象进行探讨，评估其在重述和翻译任务中的内在幻觉检测能力。通过分析不同模型在各种任务和语言中的表现，研究发现模型性能在各种任务间存在差异，但在特定提示下表现一致，且自然语言推理模型的表现同样优异，表明LLM为基础的检测方法并非唯一选择。

本研究探讨大型语言模型（LLMs）的幻觉现象，评估其在重述和翻译任务中的幻觉检测能力。结果表明，不同任务和语言下模型表现存在差异，但在特定提示下表现一致，自然语言推理模型的检测能力尤为突出，表明LLM检测方法并非唯一选择。

大型语言模型幻觉现象机器翻译翻译自然语言推理重述

原文中文，约300字，阅读约需1分钟。发表于：。

阅读原文

分享给好友

记忆复兴、持续学习及其更远之处：对预训练编码器和解码器在多模态机器翻译中的评估

本研究针对多模态机器翻译（MMT）中预训练编码器和解码器的有效性进行了系统分析。研究发现，预训练解码器在翻译质量上显著优于未预训练框架，而预训练编码器的效果则取决于视觉与文本的对齐质量，这为未来多模态翻译系统的架构设计提供了指导。

机器翻译编码器解码器

发表于：。

阅读原文

分享给好友

DIMT25@ICDAR2025：HW-TSC的端到端文档图像机器翻译系统，利用大型视觉语言模型

本研究针对文档图像机器翻译中的复杂布局问题，提出了华为翻译服务中心的技术解决方案。通过结合多任务学习与感知链思维的训练框架，构建了一个全面的端到端翻译系统，显著提升了OCR和非OCR文档图像翻译任务的效果，展示了高效的文档翻译方法。

本研究提出了一种针对文档图像机器翻译复杂布局问题的技术解决方案，结合多任务学习与感知链思维，构建了高效的端到端翻译系统，显著提升了OCR和非OCR文档的翻译效果。

OCR 华为多任务学习机器翻译翻译服务语言模型

原文中文，约200字，阅读约需1分钟。发表于：。

阅读原文

分享给好友

比较大型语言模型与传统机器翻译工具在翻译医疗咨询总结中的表现：一项初步研究

本研究解决了大型语言模型（LLMs）和传统机器翻译（MT）工具在翻译医疗咨询总结中的表现差异。研究发现，传统MT工具在复杂文本翻译中表现更佳，而LLMs在简单总结的越南语和中文翻译中展示出潜力。研究强调了在医疗翻译中需要领域特定的训练、改进的评估方法和人工监督。

本研究比较了大型语言模型（LLMs）与传统机器翻译（MT）工具在医疗咨询总结翻译中的表现。结果表明，传统MT在复杂文本翻译中更具优势，而LLMs在简单总结的越南语和中文翻译中显示出潜力。研究强调医疗翻译需要领域特定的训练和人工监督。

医疗咨询大型语言模型总结机器翻译翻译表现领域特定训练

原文中文，约300字，阅读约需1分钟。发表于：。

阅读原文

分享给好友

FairTranslate：一种用于评估机器翻译中性别偏见的英法数据集，突破性别二元性

本研究关注大型语言模型在翻译任务中对包容性语言的处理，特别是如何评估机器翻译中的非二元性别偏见。提出的FairTranslate数据集通过2418对英法句子及其注释，揭示当前主流语言模型在性别代表性方面存在显著偏差，强调了需要采取集中策略以确保翻译系统中的公平和包容性语言使用。

本研究探讨大型语言模型在翻译任务中对包容性语言的处理，特别是非二元性别偏见。通过FairTranslate数据集，揭示主流语言模型在性别代表性方面的偏差，强调需采取策略以确保翻译系统的公平与包容性。

FairTranslate 包容性语言大型语言模型性别偏见数据集机器翻译翻译任务

原文中文，约300字，阅读约需1分钟。发表于：。

阅读原文

分享给好友

人工智能代理是机器翻译的新前沿吗？单一和多代理系统在多语言数字通信中的挑战与机遇

本研究关注人工智能代理在机器翻译中的应用潜力，特别是单一和多代理系统如何提升多语言数字通信。研究表明，多代理系统能够通过专业化协作显著提高翻译准确性和上下文理解，尤其在法律翻译中展示了优于传统机器翻译的翻译质量。这项工作为未来机器翻译领域的多代理系统研究奠定了基础。

本研究探讨了人工智能代理在机器翻译中的应用，特别是单一与多代理系统对多语言沟通的提升。结果显示，多代理系统在翻译准确性上显著优于传统机器翻译，尤其在法律翻译领域，为未来研究提供了基础。

人工智能多代理系统机器翻译法律翻译翻译准确性

原文中文，约200字，阅读约需1分钟。发表于：。

阅读原文

分享给好友

既视感：通过机器翻译评估多语言大型语言模型评估

本研究解决了多语言大型语言模型（mLLMs）生成能力评估缺乏全面性和科学严谨性的问题。论文借鉴机器翻译领域的评估最佳实践，提出了一系列可操作的推荐措施，以提升mLLMs的质量评估，并确保评估方法的可靠性。研究发现，这些标准化方法有助于更好地理解不同模型之间的质量差异，对mLLMs的研究与发展具有重要影响。

本研究针对多语言大型语言模型（mLLMs）生成能力评估的不足，提出可操作的建议，借鉴机器翻译领域的最佳实践，以提高评估的质量和可靠性，推动mLLMs的研究与发展。

多语言大型语言模型机器翻译研究评估

原文中文，约300字，阅读约需1分钟。发表于：。

阅读原文

分享给好友

大型语言模型的多语言情境化用于文档级机器翻译

本研究解决了大型语言模型在文档级翻译中面临的长程依赖和话语现象建模挑战。通过针对高质量文档级数据的精细调优，我们提出了一种新方法，称为DocBlocks，能支持多种翻译范式，显著提升了文档级翻译的质量和推理速度，展示了其潜在的应用价值。

多语言大型语言模型机器翻译

发表于：。

阅读原文

分享给好友