小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
最优语料感知训练用于神经机器翻译

本文介绍了最优语料感知训练(OCAT),该方法通过微调预训练模型提升模型准确性。在翻译任务中,OCAT相较于传统训练提高了3.6和1.8的chrF分数,且具有轻量、不易过拟合和强适应性等优点。

最优语料感知训练用于神经机器翻译

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-15T00:00:00Z

本研究分析了构建本地大型语言模型(LLMs)的原因,并评估了35种日语和多语言LLMs在19个评估基准上的表现。结果表明,英语文本训练能提高日语评分,而日语特定文本训练则有助于日语知识问答和翻译任务,揭示了日本能力与计算资源的关系。

Why We Build Local Large Language Models: An Observational Analysis from 35 Japanese and Multilingual LLMs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究提出了一种新型语音理解模型,结合少量语音数据与大量文本数据,验证了其在语音识别和翻译任务中的有效性。该模型利用预训练的语言模型,在多任务和多语种环境中表现出色,具备零-shot能力,能够在低资源语言上实现良好性能,展示了构建高效语音语言模型的潜力。

无需语音指令调优数据的指令跟随语音语言模型的开发

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

本文提出结合依赖树结构与传统序列位置编码的方法,以提升中英和英德翻译任务中的自我注意力网络表现。研究表明,该方法在多项自然语言处理任务中均能稳定提高性能。

巴贝尔树:显式结构的改进表示学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

本文探讨了约束文本生成问题,提出了一种结合约束编程的方法,成功生成高度约束的文本。研究表明,详细的约束条件与大型语言模型的结合提升了文本生成的准确性和稳定性,尤其在知识图谱补全和翻译任务中表现突出。

将约束编程推理与大型语言模型预测相结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-18T00:00:00Z
通过N-best重排序实现精确的知识蒸馏

本研究提出了一种利用n-best reranking来增强序列级知识蒸馏的方法,通过从前n个最佳假设中提取学生模型训练数据的伪标签,并利用多样化的模型集合选择最高质量的假设作为标签。实验证明该方法在翻译任务上有效,最好的学生模型在参数较少的情况下达到了与大型翻译模型相当的准确性。

通过N-best重排序实现精确的知识蒸馏

Apple Machine Learning Research
Apple Machine Learning Research · 2024-07-10T00:00:00Z

本文提出了并行迭代编辑(PIE)模型,旨在解决本地序列转导问题,提升速度和准确性。同时,研究探讨了多种位置编码方法,如上下文位置编码和动态位置编码,以增强大型语言模型在处理长序列和翻译任务中的性能。

当您编辑代码时,让代码改变自己的 LLM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-03T00:00:00Z
什么时候该用多智能体是不是一定要用多智能体?

文章讨论了多智能体在翻译任务中的应用,比较了单个Prompt多步骤与多个智能体的优缺点。多智能体能够处理复杂任务并允许对中间结果进行修改,但其时间和Token成本较高。建议先使用多智能体理清流程,再考虑优化为单个Prompt。

什么时候该用多智能体是不是一定要用多智能体?

宝玉的分享
宝玉的分享 · 2024-06-26T00:24:00Z

本文探讨了大型语言模型(LLM)自我纠错的作用,发现其在缺乏外部反馈时难以自我修正,甚至可能导致性能下降。研究提出了一种基于“confidence”的提示框架,以提升自我纠正的准确性,并探讨了自我纠正对可信度和真实性的影响。实验证明,改进的自我纠正机制能显著提高模型性能,尤其在翻译和推理任务中。

LLM 能够自我纠错的实际时机研究:对 LLM 自我纠错的关键调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

通过重新制定微调期间的输入,利用预训练模型在新颖的方式下发挥其优势,无需额外收集训练数据或在推理时修改数据,这些简单的数据级别修改方案在单语言对翻译任务或大规模多语言翻译任务中都可以应用,实验证明这些技术在 Flores200 翻译基准测试中实现了显著的性能提升达到 3.5 chrF++。我们希望通过提高微调数据效率的可访问性,使训练更加有效,以达到可扩展改进的最新性能水平。

RIFF: 学习改写输入以便对语言模型进行少样本微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-04T00:00:00Z

该文介绍了一种新的微调方法,设计了一种面向翻译任务的先进语言模型的翻译器ALMA,该模型在WMT'21和WMT'22的测试数据集上相比之前的工作和具有7B或13B参数的模型有着显著性能提升,并为机器翻译领域的新的训练范式奠定了基础。

语言模型之超级马里奥:从同源模型中吸收能力如午餐一般

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-06T00:00:00Z

本研究介绍了WeChat AI在WMT 2021共享新闻翻译任务中的参与,并使用Transformer等多种方法生成大量合成数据,实现了英语到中文、英语到日语、日语到英语和英语到德语的翻译。通过高级微调方法和基于Self-BLEU的模型加强,得到了36.9、46.9、27.8和31.3的BLEU分数。其中英语到中文、英语到日语和日语到英语的BLEU分数最高,英语到德语的BLEU分数是有限制提交中最高的。

VLSP 2022 年 VBD-MT 中越翻译系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码