小红花·文摘

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

freeCodeCamp.org ·

构建基于注意力机制的序列到序列（Seq2Seq）模型用于语言翻译

MachineLearningMastery.com ·

GAN作者追忆往事：论文是DDL前一周开始写的，最初在NeurIPS大会无人问津

机器之心 ·

刚刚，Ilya的Seq2Seq、Ian的GAN获NeurIPS时间检验奖

机器之心 ·

在2024年NeurIPS大会上，GAN和Seq2Seq两篇经典论文获得时间检验奖。GAN由Yoshua Bengio等提出，利用生成对抗网络实现高质量数据生成；Seq2Seq由Ilya等人提出，解决了输入输出序列长度不定的问题，推动了机器翻译等领域的发展。

史无前例！Seq2Seq和GAN同获NeurIPS时间检验奖，Ilya连续2年获奖

量子位 ·

本研究提出了一种基于Transformer的手语翻译系统，结合CTC损失实现端到端训练，在PHOENIX14T数据集上取得了先进的翻译效果。研究强调了手语翻译中的挑战，并建议采用人机互动设计和不同的手语注释方式，以提高翻译质量。

美国手语到文本的翻译：基于Transformer和Seq2Seq的LSTM方法

BriefGPT - AI 论文速递 ·

本文介绍了使用Python和TensorFlow/Keras实现序列到序列（Seq2Seq）模型的方法。Seq2Seq模型由编码器和解码器组成，编码器将输入序列编码成上下文向量，解码器根据该向量生成目标序列。文章还提供了一个简单的英法翻译任务的示例代码，并介绍了训练和推理模型的过程。希望读者能通过本文了解Seq2Seq模型的原理和实现方法，并尝试更复杂的模型和任务。

使用Python实现深度学习模型：序列到序列模型（Seq2Seq）

华为云官方博客 ·

本报告介绍了OpenBA，一个开源的150亿双语不对称seq2seq模型，展示了其在多个基准测试中的优越性能。通过三阶段训练策略和有效技术，OpenBA在资源有限的情况下表现出色。此外，Baichuan 2系列模型在公共基准测试中表现优异，尤其在医学和法律领域。研究还提出了多语言LLM压缩方法，以改善低资源语言的性能。

OpenBA-V2：使用快速多阶段剪枝达到 77.3% 的高压缩比

BriefGPT - AI 论文速递 ·

本文探讨了序列到序列方法在无监督和半监督学习中的应用，特别是在人体活动识别和时间序列分割任务中。这些方法有效提取特征，提高识别性能，并在处理传感器数据时表现优异。

P2LHAP: 基于可穿戴传感器的人体活动识别、分割和预测的 Patch-to-Label Seq2Seq Transformer

BriefGPT - AI 论文速递 ·

该文介绍了一种解码干预框架，利用评论家评估生成的令牌适当性，并在动态影响下选择令牌。实验结果表明该框架优于基准线，达到最先进方法水平。

本文提出了一个基于全面时间戳监督设置的 seq2seq 翻译的统一框架，用于解决视频动作分割问题。框架通过引入辅助监督信号和独立的对齐解码器，以及针对标准 Transformer seq2seq 翻译模型的模块化方法，能够应对长输入序列和相对较少的视频输出序列。通过有限 k-medoid 算法将框架扩展到基于时间戳的监督设置，用于生成伪分割。该框架在完全和时间戳监督设置中表现一致，胜过或与几个数据集上的最先进算法相竞争。

运动到语言：无监督学习的同步语义运动分割

BriefGPT - AI 论文速递 ·

我在写上一篇博客《》时，有读者在文章下面评论道：“july大神，请问BERT的通俗理解还做吗？”，我当时给他发了张俊林老师的BERT文章，所以没太在意。直到今天早上，刷到CSDN上一篇讲BERT的文章，号称一文读懂，我读下来之后，假定我是初学者，读不懂。（这是），再比如国内张俊林老师的这篇《》，然后你会发现几乎网上关于Transformer/BERT的文章无外乎是以下这几种情况。

Transformer通俗笔记：从Word2Vec、Seq2Seq逐步理解到GPT、BERT

结构之法算法之道 ·

《GPT 图解》笔记：Seq2Seq及点积注意力

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

构建基于注意力机制的序列到序列（Seq2Seq）模型用于语言翻译

构建一个简单的序列到序列（Seq2Seq）模型用于语言翻译

GAN作者追忆往事：论文是DDL前一周开始写的，最初在NeurIPS大会无人问津

刚刚，Ilya的Seq2Seq、Ian的GAN获NeurIPS时间检验奖

史无前例！Seq2Seq和GAN同获NeurIPS时间检验奖，Ilya连续2年获奖

美国手语到文本的翻译：基于Transformer和Seq2Seq的LSTM方法

使用Python实现深度学习模型：序列到序列模型（Seq2Seq）

OpenBA-V2：使用快速多阶段剪枝达到 77.3% 的高压缩比

P2LHAP: 基于可穿戴传感器的人体活动识别、分割和预测的 Patch-to-Label Seq2Seq Transformer

通过解码干预提升 Seq2Seq 语法错误修正

运动到语言：无监督学习的同步语义运动分割

Transformer通俗笔记：从Word2Vec、Seq2Seq逐步理解到GPT、BERT