小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文回顾了2014年Bahdanau等人提出的注意力机制在神经机器翻译中的应用。该机制通过动态计算上下文向量,克服了固定长度向量的局限性,显著提升了长句翻译的质量。Bahdanau的研究为现代自然语言处理中的注意力机制奠定了基础,尽管后来被Transformer取代,但其核心思想仍然具有深远影响。

【Transformer 与注意力机制】12|Bahdanau Attention:注意力的早期形态

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-15T00:00:00Z
2025年12月21日Python Hub周刊摘要

本周Python动态:Claude通过Hugging Face Skills工具进行微调,支持云GPU作业;facebookresearch/sam3发布Meta Segment Anything Model 3的推理与微调代码;新视频探讨神经机器翻译的演变,包含7篇重要论文的PyTorch实现;kubesdk是一个异步全类型的Kubernetes Python SDK。祝大家编程愉快!

2025年12月21日Python Hub周刊摘要

Python Hub Weekly
Python Hub Weekly · 2025-12-21T18:00:00Z
从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

该课程在freeCodeCamp.org YouTube频道上详细讲解了神经机器翻译的发展历程,包括RNN、LSTM和Seq2Seq模型的历史突破及其数学原理,并通过PyTorch实验帮助学习者逐步重建这些重要论文。

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

freeCodeCamp.org
freeCodeCamp.org · 2025-12-10T15:23:41Z
在容器中部署Azure AI代理翻译器

Azure AI Translator是一个云端神经机器翻译服务,支持实时文本和文档翻译,用户可创建自定义翻译模型,支持100多种语言。通过容器部署,用户可在本地或私有云中运行,以确保数据安全并降低延迟和成本。

在容器中部署Azure AI代理翻译器

DEV Community
DEV Community · 2025-03-18T17:44:06Z

本文介绍了2014年提出的神经机器翻译中的注意力机制,该机制通过联合学习对齐和翻译,使模型在生成每个目标词时动态选择相关源词信息,从而克服传统固定长度向量的局限性,提升长句翻译性能。

[译][论文] Attention paper | 神经机器翻译:联合学习对齐和翻译(2014)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-03-01T00:00:00Z

该研究提出了一种基于枢轴翻译的单模型集成框架,旨在提升低资源语言对的神经机器翻译性能。通过知识转移,该方法生成多样且准确的翻译候选,并通过选择高质量候选进行聚合,从而显著提高翻译质量。实验结果表明,该方法有效捕捉源句的细微差异,提供更优质的翻译。

A Single Model Ensemble Framework for Neural Machine Translation Based on Pivot Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本研究提出ProNMT框架,旨在解决神经机器翻译中代词翻译的难题,通过质量评估和概率反馈机制优化训练,显著提升代词翻译的准确性及整体翻译质量。

Feedback Training Based on Quality Assessment to Improve Pronoun Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z

本研究提出了一种“注册”人工标记的方法,以提升多语言神经机器翻译模型的性能。实验结果表明,该方法在大型基准测试中优于其他方法,接近商业大型语言模型的效果。

Registering Source Tokens to Target Language Spaces in Multilingual Neural Machine Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z

本研究探讨了神经机器翻译模型在领域适应中遭遇的灾难性遗忘问题,分析了遗忘的原因及其与适应数据的关系,发现遗忘量与目标词汇覆盖率相关,为NMT领域适应的改进提供了新思路。

Machine Translation for Domain Adaptation: Content and Causes of Catastrophic Forgetting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z

本研究探讨了在极低资源环境下多语言神经机器翻译中的知识转移问题。通过TX-Ray方法,提出了一种基于最小平行数据的预训练和多任务学习策略,显著提升了模型性能。同时,研究发现削减神经元知识会对模型的鲁棒性和泛化能力产生负面影响。

Understanding and Analyzing Model Robustness and Knowledge Transfer in Multilingual Neural Machine Translation: A TX-Ray Approach

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

该研究提出了一种新奖励机制,旨在解决神经机器翻译系统中因训练数据词汇偏见导致的翻译语言贫乏问题。实验结果表明,该机制能够提高翻译的自然性和内容保留,使翻译更接近人类书写风格。

Multi-perspective Alignment for Enhancing Naturalness in Neural Machine Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究针对多语言神经机器翻译中解码器架构的语言迁移能力不足问题,提出了一种创新方法,通过将解码过程分为两个阶段并施加对比学习,实验结果表明该方法在零-shot翻译中显著提升了性能。

Improving Language Transfer Capability of Decoder Architecture in Multilingual Neural Machine Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本文探讨了英、泰、僧三语并行语料库中低资源语言(僧伽罗语和泰米尔语)的命名实体标注问题,利用预训练的多语言模型建立了新的基准识别结果,展示了其在低资源神经机器翻译中的应用价值。

English-Thai-Sinhala Parallel Named Entity Annotation Corpus

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

本研究提出了一种新型对抗攻击方法,针对神经机器翻译(NMT)模型。通过在句子间插入一个词,研究者能够使第二个句子在翻译中被忽略,从而隐藏恶意信息。实验结果显示,超过50%的NMT模型对这种攻击表现出脆弱性。

NMT Obfuscation Attack: Ignoring a Sentence in Translation with One Word

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本文提出了一种基于神经机器翻译的实时翻译框架,通过代理决策实现实时翻译,控制翻译质量与延迟。研究展示了wait-k策略、增量Transformer和流级别延迟评估等方法的有效性,显著提升了翻译性能和速度。同时,通过双层优化和课程学习增强了同步机器翻译模型的能力,强调了并行数据预训练的重要性。

通过大型语言模型预测未来的同步机器翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本文探讨了神经机器翻译(NMT)与短语统计机器翻译(PBSMT)在文学翻译中的应用,研究表明NMT在多个评估中优于PBSMT。同时,提出了新的评估方法,并探讨了大型语言模型(LLMs)在翻译质量评估中的潜力,强调了参考翻译的重要性及对传统评估方法的重新审视。

大型语言模型在文学翻译中的真实表现如何?与人类和大型语言模型的文学翻译评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本研究首次提出了一种神经机器翻译系统,填补了阿罗马尼亚语翻译的空白,并发布了最大的阿罗马尼亚语-罗马尼亚语双语语料库,推动低资源语言的翻译技术发展。

阿罗马尼亚语的方言和低资源机器翻译

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

本文分析了神经机器翻译系统的适应性,提出了多种适配器方法以提高领域适应性能。研究表明,适配器的组合方式对性能影响显著,提出的$k$NN-Adapter和UniPELT框架有效减少参数并提升性能,强调了适配器在资源节约和高效微调中的潜力。

中性残差:重新审视模型扩展的适配器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文探讨了多领域神经机器翻译方法,提出通过预训练语言模型和领域自适应技术提升翻译质量。研究表明,预先指定领域是必要的,但即使在未知领域也能实现高质量翻译。此外,微调大型语言模型在翻译任务中表现优异,尤其在低资源语言应用中,领域相似性对模型性能影响显著。

大型语言模型在多领域翻译中的应用:基准测试与领域链思维微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本研究提出了括号术语翻译(PTT)任务,以提高技术术语的翻译准确性。通过生成PTT数据集并优化神经机器翻译模型,研究发现细调方法在目标语言模型中的表现优于少量示例提示,为术语翻译提供了新见解。

Efficient Technical Term Translation: A Knowledge Distillation Method for Parenthetical Terminology Translation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-01T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码