本文探讨了多语言预训练和微调在翻译模型中的应用,证明其在性能不减的情况下可扩展至更多语言。研究表明,基于ML50数据集的多语言微调显著提升了模型效果,并通过构建开源数据集和知识增强方法,提升了大语言模型的跨语言能力。FuxiTranyu模型在多语言基准测试中表现优异,推动了多语言模型的研究进展。
本研究提出了一种迭代双语理解翻译方法(IBUT),通过大型语言模型的跨语言能力生成反馈,逐步提升理解,减少错误,提高翻译质量。实验结果显示,IBUT在多个领域表现优于其他方法。
本文评估了大型语言模型(LLMs)在医疗领域的表现,探讨了其在临床语言理解和医学问答中的应用。研究引入自问自答提示策略,提升了模型在医疗任务中的效果,并指出了跨语言能力的不足。通过多语言实验,强调了增强模型能力和公平信息生态系统的必要性,展示了从传统预训练模型向大型语言模型的转变及其在医学领域的潜力与挑战。
本文提出了一种通过标记级别协作训练多个大型语言模型的方法,允许基础模型在生成时调用领域专家模型,从而优化指令遵循和领域特定任务的性能。此外,研究展示了多级对比学习框架,显著提升了跨语言能力,并提出无监督特征分解方法,改善了跨领域和跨语言任务的表现。
本文提出了一种多级对比学习框架,使用翻译后的平行数据并整合每对平行句子的单词级信息进行对比学习,提高预训练模型的跨语言能力。采用交叉零噪声对比估计损失减轻训练过程中误差的影响。该方法提高了基础模型的跨语言迁移能力,在多个跨语言任务中表现优异。
完成下面两步后,将自动完成登录并继续当前操作。