机器之心 ·

图灵奖得主Yoshua Bengio新作：Were RNNs All We Needed?

💡 原文中文，约5700字，阅读约需14分钟。

📝

内容提要

自Transformer模型出现后，研究者重新关注RNN模型。Yoshua Bengio团队提出minLSTM和minGRU，通过去除隐藏状态依赖，实现并行训练，提高速度和效率。实验显示，这些模型在多项任务中表现优异，尤其在长序列任务中表现突出，显示了RNN的潜力。

🎯

❓

minLSTM和minGRU通过去除隐藏状态依赖，实现并行训练，显著提高了训练速度和效率。

在长序列任务中，minLSTM和minGRU表现优异，能够与Transformer相媲美。

minLSTM和minGRU的训练速度分别比传统RNN快235倍和175倍。

自Transformer模型问世以来，研究者希望用RNN模型解决Transformer在长上下文处理中的问题。

在选择性复制任务中，minLSTM和minGRU的性能优于许多流行的序列模型。

minLSTM和minGRU在参数效率上显著提高，使用的参数数量远低于传统LSTM和GRU。

🏷️

TeamCity 2025.11.5版本已发布
Our (most likely) final update for TeamCity 2025.11 On-Premises servers has j...
埃隆·马斯克与山姆·阿尔特曼关于OpenAI未来的法律斗争
埃隆·马斯克与山姆·阿尔特曼之间的法律斗争即将开始，涉及OpenAI的未来。马斯克指控OpenAI偏离了最初使命，追求利润，并要求解除阿尔特曼和布罗克曼的...
Firefox正在进行圆形界面的重新设计，便于找到隐私和人工智能的控制选项
Firefox is getting a drastic visual overhaul with a redesigned Settings secti...
在绝望的时刻，毕业生们通过羞辱科技高管找到希望
University graduates are booing and heckling corporate executives who praise ...
谁有权拥有路易吉·曼吉奥内的故事？
纽约州法庭审理了路易吉·曼吉奥内涉嫌谋杀联合医疗首席执行官布莱恩·汤普森的案件。法官裁定部分证据不能提交陪审团。曼吉奥内的支持者在庭外发表激烈言论，引发媒...
飞利浦新款显示器具有双面屏幕
飞利浦推出新型双面显示器24B2D5300，适合多人同时查看，配备两个23.8英寸LCD面板，分辨率1920 x 1080，支持USB-C和HDMI连接，...