小红花·文摘

递归神经网络（RNN）用于处理序列数据，具备内部状态（记忆），适应多种输入输出结构。RNN通过递归公式更新隐藏状态并生成输出。长短期记忆（LSTM）通过门控机制解决梯度消失问题，增强信息流动。

CS231n 讲义 VII：递归神经网络

Louis Aeilot's Blog ·

递归神经网络（RNN）：全面指南

DEV Community ·

本研究探讨了递归神经网络（RNN）在序列数据学习中的维度问题，提出了一种非自治动态系统方法，建立了状态空间子集的分形维度上限。当输入序列来自N维可逆动态系统时，该子集的分形维度上限为N。这一结果对RNN的维度减少及动态系统的分形维度估计具有重要意义。

递归神经网络中回拉吸引子的维度研究

BriefGPT - AI 论文速递 ·

第8部分：构建自己的人工智能 - 用于序列数据的递归神经网络（RNN）

DEV Community ·

液态人工智能如何挑战基于变换器的人工智能模型

The New Stack ·

本文提出了SigGPDE，一种新的稀疏变分推理框架，专门用于处理序列数据上的高斯过程。该框架通过诱导变量实现稀疏近似，避免了矩阵求逆，并证明了GP签名核的梯度是双曲型偏微分方程的解，从而优化了ELBO。SigGPDE在大规模数据集上显著提高了计算效率和分类性能。

通过相关性追求实现鲁棒高斯过程

BriefGPT - AI 论文速递 ·

理解循环神经网络（RNN）

DEV Community ·

本文研究了状态空间模型（SSM）的普适性，并提出了改进训练算法的方法。通过建立普适性度量模型和引入正则化方法，提高了SSM对序列数据的稳健性和性能。

通过深度状态空间模型的频谱视角评估时间序列训练数据集

BriefGPT - AI 论文速递 ·

一文看懂Mamba，Transformer最强竞争者

机器之心 ·

《注意力就是你所需要的》是一篇经典论文，介绍了Transformer架构的重要性和应用。该架构利用注意力机制提高了序列数据的处理能力，加速了训练时间，并在自然语言处理等领域取得了突破。注意力机制是Transformer的核心组件，通过缩放点积注意力和多头注意力来计算表示。这一论文的发表推动了人工智能领域的创新和发展。