小红花·文摘

神经网络通过前向传播、损失计算、反向传播和梯度下降进行训练。每个神经元执行线性打分和非线性激活，多个神经元组成层，层与层之间的非线性使网络能够拟合复杂函数。递归神经网络（RNN）通过引入状态，克服了多层感知器（MLP）在序列任务中的局限性。训练过程是参数在损失曲面上逐步优化的过程。

【Transformer 与注意力机制】08.5 神经网络基础：从 MLP 到 RNN 的最后一块地基

土法炼钢兴趣小组的博客 ·

ParaRNN：大规模非线性递归神经网络，可并行训练

Apple Machine Learning Research ·

苹果在ICLR 2026的机器学习研究

Apple Machine Learning Research ·

递归神经网络（RNN）用于处理序列数据，具备内部状态（记忆），适应多种输入输出结构。RNN通过递归公式更新隐藏状态并生成输出。长短期记忆（LSTM）通过门控机制解决梯度消失问题，增强信息流动。

CS231n 讲义 VII：递归神经网络

Louis Aeilot's Blog ·

本研究提出了一种层次稀疏注意力（HSA）机制，解决了递归神经网络（RNN）在随机访问历史上下文方面的局限性。结合HSA与Mamba形成的RAMba在6400万上下文中实现了完美的密码检索准确率，展示了其在长上下文建模中的潜力。

Random Long-Context Access for Mamba via Hardware-aligned Hierarchical Sparse Attention

BriefGPT - AI 论文速递 ·

本研究提出了一种新的递归神经网络机制Lattice，旨在降低序列学习中注意力机制的计算复杂性。Lattice通过利用K-V矩阵的低秩结构高效压缩内存，显著减少计算复杂度。实验结果表明，Lattice在不同上下文长度下的表现优于现有方法，尤其在上下文长度增加时，性能提升更为明显。

Lattice: Learning to Efficiently Compress Memory

BriefGPT - AI 论文速递 ·

《百页语言模型书》由安德里·布尔科夫撰写，旨在帮助读者理解大型语言模型（LLM）。书中涵盖机器学习基础、语言模型原理、递归神经网络、变换器模型及现代LLM的影响，适合初学者和专业人士，提供深入的技术基础，助力人工智能领域的学习与应用。

《百页语言模型书：大型语言模型的精彩技术入门》

KDnuggets ·

本研究探讨了递归神经网络（RNN）在序列数据学习中的维度问题，提出了一种非自治动态系统方法，建立了状态空间子集的分形维度上限。当输入序列来自N维可逆动态系统时，该子集的分形维度上限为N。这一结果对RNN的维度减少及动态系统的分形维度估计具有重要意义。

递归神经网络中回拉吸引子的维度研究

BriefGPT - AI 论文速递 ·

本研究聚焦于通过神经活动解码人类言语，帮助失去言语能力的瘫痪患者恢复沟通。研究表明，多模型集成方法显著提升了解码准确率，并优化了递归神经网络模型的训练过程，展示了在脑至文本算法准确性方面的持续进展。

Brain-to-Text Benchmark '24: Lessons Learned

BriefGPT - AI 论文速递 ·

TDoC '24 第四天：深入探讨神经网络与Tacotron2文本到语音

DEV Community ·

本研究提出了一种基于递归神经网络的抑郁情绪检测方法，针对社交媒体孟加拉文文本进行情感分析。通过对983条文本的预处理和特征提取，结果表明该方法能够有效识别抑郁情绪，为心理学家提供情感分析工具，帮助改善抑郁患者的生活。

Depression Detection from Social Media Bangla Text Using Recurrent Neural Networks

BriefGPT - AI 论文速递 ·

本研究提出了一种新计算框架，将递归神经网络与人类反应时间对齐，以更好地模拟人类行为选择。该框架优化了决策模型，实现了速度与准确性的平衡，显著提升了对人类反应时间数据的拟合效果。

RTify: Aligning Deep Neural Networks with Human Behavioral Decisions

BriefGPT - AI 论文速递 ·

液态人工智能如何挑战基于变换器的人工智能模型

The New Stack ·

本研究提出动态相似性分析（DSA），有效解决了现有指标在递归神经网络（RNN）表示分析中的不足。DSA在识别与行为相关的表示时具有更强的抗噪声能力，显著提升了对计算过程的理解和网络学习任务的揭示。

Dynamical Similarity Analysis Uniquely Captures the Development of Computations in Recurrent Neural Networks

BriefGPT - AI 论文速递 ·

本文探讨了深度强化学习在自动驾驶汽车竞速中的应用，结合迁移学习和递归神经网络，显著提升了AI代理在模拟环境中的表现，推动了自动驾驶技术的发展。

自动驾驶汽车竞速：深度强化学习的应用

BriefGPT - AI 论文速递 ·

本研究探讨递归神经网络（RNN）的外延性质，指出该领域存在重要空白。作者提出瑞斯定理，证明任何非平凡的RNN外延性质不可判定，揭示了判断RNN关键特性的困难，对理论研究和应用影响深远。

Extensional Properties of Recurrent Neural Networks

BriefGPT - AI 论文速递 ·

本研究探讨了元强化学习在因果推理中的应用，训练递归神经网络进行无模型强化学习，证明其在新情境下进行因果推断和反事实预测的能力。研究提出了新的学习方法和算法，强调因果结构的快速适应性及其在复杂推理场景中的有效性，展示了因果模型的分类和识别方法的进展。

具备切换因果关系的系统：一种元因果视角

BriefGPT - AI 论文速递 ·

该研究探讨了机器学习架构在动态系统预测中的可迁移性。分析表明，神经门控和注意力机制能提升递归神经网络（RNN）的性能，而在变换器中引入递归概念效果不佳。结合递归高速公路网络的架构在高维时空预测中表现最佳。

Deconstructing Recurrence, Attention, and Gating: Investigating the Transferability of Transformers and Gated Recurrent Neural Networks in Dynamic System Forecasting

BriefGPT - AI 论文速递 ·

该研究探讨了利用自监督学习和IMU传感器捕捉人类与狗的视角视频，以识别自传活动。提出了多模态数据集和基于递归神经网络的方法，旨在提高物体操纵行为的预测精度。此外，研究介绍了EgoGen合成数据生成器，以提供真实数据，解决增强现实中的人类运动模拟挑战。

HEADS-UP：用于盲人辅助系统的头戴式自我中心数据集以实现轨迹预测

BriefGPT - AI 论文速递 ·

神经算法推理（NAR）研究通过神经网络实现经典算法，展示了在复杂问题解决中的潜力。研究提出了CLRS算法推理基准，涵盖多种算法，并通过图神经网络和递归神经网络优化算法学习，显著提升了性能。

具有多种正确解的神经算法推理

BriefGPT - AI 论文速递 ·