小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

该课程在freeCodeCamp.org YouTube频道上详细讲解了神经机器翻译的发展历程,包括RNN、LSTM和Seq2Seq模型的历史突破及其数学原理,并通过PyTorch实验帮助学习者逐步重建这些重要论文。

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

freeCodeCamp.org
freeCodeCamp.org · 2025-12-10T15:23:41Z
构建基于注意力机制的序列到序列(Seq2Seq)模型用于语言翻译

本文介绍了如何构建和训练基于注意力机制的序列到序列(seq2seq)模型用于语言翻译。强调了注意力机制的重要性及其在seq2seq模型中的实现,解决了传统模型依赖单一上下文向量的局限性。通过使用GRU模块,本文详细描述了模型的具体实现和训练过程。

构建基于注意力机制的序列到序列(Seq2Seq)模型用于语言翻译

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-28T17:26:05Z
构建一个简单的序列到序列(Seq2Seq)模型用于语言翻译

本文介绍了如何构建和训练基于LSTM的序列到序列(seq2seq)模型,用于英语到法语的翻译。模型采用编码器-解码器架构,编码器处理输入序列生成上下文向量,解码器基于该向量生成输出序列。文章详细讲解了数据集准备、模型实现、训练过程及改进方法,并强调了注意力机制的重要性。

构建一个简单的序列到序列(Seq2Seq)模型用于语言翻译

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-22T02:27:18Z
GAN作者追忆往事:论文是DDL前一周开始写的,最初在NeurIPS大会无人问津

NeurIPS 2024颁发时间检验奖,首次同时授予Ilya Sutskever的Seq2Seq和Ian Goodfellow的生成对抗网络(GAN)。GAN论文引用超过85000次,推动了生成模型的研究与应用。作者Sherjil Ozair回顾了GAN的诞生,强调深度学习的影响及未来创新潜力。

GAN作者追忆往事:论文是DDL前一周开始写的,最初在NeurIPS大会无人问津

机器之心
机器之心 · 2024-12-06T02:18:24Z
刚刚,Ilya的Seq2Seq、Ian的GAN获NeurIPS时间检验奖

2024年NeurIPS时间检验奖颁给了Ian Goodfellow的生成对抗网络(GAN)和Ilya Sutskever的Seq2Seq。GAN在图像生成领域取得了重大突破,引用超过85000次;Seq2Seq推动了机器翻译的发展,引用超过27000次。这两篇论文对人工智能领域产生了深远影响。

刚刚,Ilya的Seq2Seq、Ian的GAN获NeurIPS时间检验奖

机器之心
机器之心 · 2024-11-28T02:13:11Z

在2024年NeurIPS大会上,GAN和Seq2Seq两篇经典论文获得时间检验奖。GAN由Yoshua Bengio等提出,利用生成对抗网络实现高质量数据生成;Seq2Seq由Ilya等人提出,解决了输入输出序列长度不定的问题,推动了机器翻译等领域的发展。

史无前例!Seq2Seq和GAN同获NeurIPS时间检验奖,Ilya连续2年获奖

量子位
量子位 · 2024-11-28T02:00:18Z

本研究比较了Transformer和Seq2Seq模型在美国手语翻译中的效果,结果显示Transformer模型在蓝色分数上优于Seq2Seq模型。引入ResidualLSTM反而降低了Transformer的性能,显示出Transformer与ResidualLSTM不兼容。

美国手语到文本的翻译:基于Transformer和Seq2Seq的LSTM方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-17T00:00:00Z

RNN, LSTM, and GRU: Compare Three kinds of Seq2Seq model

DEV Community
DEV Community · 2024-08-30T06:10:30Z

本文介绍了使用Python和TensorFlow/Keras实现序列到序列(Seq2Seq)模型的方法。Seq2Seq模型由编码器和解码器组成,编码器将输入序列编码成上下文向量,解码器根据该向量生成目标序列。文章还提供了一个简单的英法翻译任务的示例代码,并介绍了训练和推理模型的过程。希望读者能通过本文了解Seq2Seq模型的原理和实现方法,并尝试更复杂的模型和任务。

使用Python实现深度学习模型:序列到序列模型(Seq2Seq)

华为云官方博客
华为云官方博客 · 2024-06-06T01:56:12Z

本文提出了一个基于序列到序列解决视频动作分割的统一框架,通过全面时间戳监督设置的 seq2seq 翻译,映射视频帧序列到动作分段序列,解决动作分割问题。通过修改和辅助损失函数,以及针对长输入序列和较少视频输出序列的模块化方法,提高了模型性能。在完全和时间戳监督设置中,该框架表现出色,超过了几个数据集上的最先进算法。

基于动作 - 过渡感知边界对齐的高效有效的弱监督动作分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-28T00:00:00Z

P2LHAP是一种新的Patch-to-Label Seq2Seq框架,能够从传感器数据中同时分割、识别和预测人类活动。它通过补丁级表示和平滑技术实现准确识别活动边界,并在三个任务中优于现有技术水平。

P2LHAP: 基于可穿戴传感器的人体活动识别、分割和预测的 Patch-to-Label Seq2Seq Transformer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

该文介绍了一种解码干预框架,利用评论家评估生成的令牌适当性,并在动态影响下选择令牌。实验结果表明该框架优于基准线,达到最先进方法水平。

通过解码干预提升 Seq2Seq 语法错误修正

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

本文提出了一个基于全面时间戳监督设置的 seq2seq 翻译的统一框架,用于解决视频动作分割问题。框架通过引入辅助监督信号和独立的对齐解码器,以及针对标准 Transformer seq2seq 翻译模型的模块化方法,能够应对长输入序列和相对较少的视频输出序列。通过有限 k-medoid 算法将框架扩展到基于时间戳的监督设置,用于生成伪分割。该框架在完全和时间戳监督设置中表现一致,胜过或与几个数据集上的最先进算法相竞争。

运动到语言:无监督学习的同步语义运动分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

我在写上一篇博客《》时,有读者在文章下面评论道:“july大神,请问BERT的通俗理解还做吗?”,我当时给他发了张俊林老师的BERT文章,所以没太在意。直到今天早上,刷到CSDN上一篇讲BERT的文章,号称一文读懂,我读下来之后,假定我是初学者,读不懂。(这是),再比如国内张俊林老师的这篇《》,然后你会发现几乎网上关于Transformer/BERT的文章无外乎是以下这几种情况。

Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT

结构之法 算法之道
结构之法 算法之道 · 2022-10-23T15:03:05Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码