小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了多语言预训练和微调在翻译模型中的应用,证明其在性能不减的情况下可扩展至更多语言。研究表明,基于ML50数据集的多语言微调显著提升了模型效果,并通过构建开源数据集和知识增强方法,提升了大语言模型的跨语言能力。FuxiTranyu模型在多语言基准测试中表现优异,推动了多语言模型的研究进展。

使用单一源语言的大规模机器翻译语料库进行多语言预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究提出了一种迭代双语理解翻译方法(IBUT),通过大型语言模型的跨语言能力生成反馈,逐步提升理解,减少错误,提高翻译质量。实验结果显示,IBUT在多个领域表现优于其他方法。

基于大型语言模型的迭代双语理解翻译推断

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本文评估了大型语言模型(LLMs)在医疗领域的表现,探讨了其在临床语言理解和医学问答中的应用。研究引入自问自答提示策略,提升了模型在医疗任务中的效果,并指出了跨语言能力的不足。通过多语言实验,强调了增强模型能力和公平信息生态系统的必要性,展示了从传统预训练模型向大型语言模型的转变及其在医学领域的潜力与挑战。

大型语言模型是否是真正的全才医护人员? 超越医生考试进行健康专业基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本文提出了一种通过标记级别协作训练多个大型语言模型的方法,允许基础模型在生成时调用领域专家模型,从而优化指令遵循和领域特定任务的性能。此外,研究展示了多级对比学习框架,显著提升了跨语言能力,并提出无监督特征分解方法,改善了跨领域和跨语言任务的表现。

联合训练语言模型中的解读意识多语言学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

本文提出了一种多级对比学习框架,使用翻译后的平行数据并整合每对平行句子的单词级信息进行对比学习,提高预训练模型的跨语言能力。采用交叉零噪声对比估计损失减轻训练过程中误差的影响。该方法提高了基础模型的跨语言迁移能力,在多个跨语言任务中表现优异。

预训练 - 微调模式中出现的任务交叉线性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码