小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

神经网络通过前向传播、损失计算、反向传播和梯度下降进行训练。每个神经元执行线性打分和非线性激活,多个神经元组成层,层与层之间的非线性使网络能够拟合复杂函数。递归神经网络(RNN)通过引入状态,克服了多层感知器(MLP)在序列任务中的局限性。训练过程是参数在损失曲面上逐步优化的过程。

【Transformer 与注意力机制】08.5 神经网络基础:从 MLP 到 RNN 的最后一块地基

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-10T00:00:00Z
ParaRNN:大规模非线性递归神经网络,可并行训练

苹果研究人员提出了ParaRNN框架,显著提高了非线性递归神经网络(RNN)的训练效率,实现了大规模并行训练。该方法使得7亿参数的RNN在语言建模任务中表现出与变换器相当的性能,且通过引入牛顿法,ParaRNN在保持非线性表达能力的同时实现了高效的并行计算。这一进展为RNN的广泛应用和进一步研究提供了新的可能性。

ParaRNN:大规模非线性递归神经网络,可并行训练

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-23T00:00:00Z
苹果在ICLR 2026的机器学习研究

苹果在ICLR 2026会议上展示了多项机器学习研究,包括高效的递归神经网络训练、状态空间模型工具、统一的多模态模型Manzano,以及蛋白质折叠的新方法SimpleFold。这些研究旨在推动AI和ML领域的进步,并支持相关社区。

苹果在ICLR 2026的机器学习研究

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-22T00:00:00Z

递归神经网络(RNN)用于处理序列数据,具备内部状态(记忆),适应多种输入输出结构。RNN通过递归公式更新隐藏状态并生成输出。长短期记忆(LSTM)通过门控机制解决梯度消失问题,增强信息流动。

CS231n 讲义 VII:递归神经网络

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-07T13:30:09Z

本研究提出了一种层次稀疏注意力(HSA)机制,解决了递归神经网络(RNN)在随机访问历史上下文方面的局限性。结合HSA与Mamba形成的RAMba在6400万上下文中实现了完美的密码检索准确率,展示了其在长上下文建模中的潜力。

Random Long-Context Access for Mamba via Hardware-aligned Hierarchical Sparse Attention

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究提出了一种新的递归神经网络机制Lattice,旨在降低序列学习中注意力机制的计算复杂性。Lattice通过利用K-V矩阵的低秩结构高效压缩内存,显著减少计算复杂度。实验结果表明,Lattice在不同上下文长度下的表现优于现有方法,尤其在上下文长度增加时,性能提升更为明显。

Lattice: Learning to Efficiently Compress Memory

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

《百页语言模型书》由安德里·布尔科夫撰写,旨在帮助读者理解大型语言模型(LLM)。书中涵盖机器学习基础、语言模型原理、递归神经网络、变换器模型及现代LLM的影响,适合初学者和专业人士,提供深入的技术基础,助力人工智能领域的学习与应用。

《百页语言模型书:大型语言模型的精彩技术入门》

KDnuggets
KDnuggets · 2025-03-13T14:00:47Z

本研究探讨了递归神经网络(RNN)在序列数据学习中的维度问题,提出了一种非自治动态系统方法,建立了状态空间子集的分形维度上限。当输入序列来自N维可逆动态系统时,该子集的分形维度上限为N。这一结果对RNN的维度减少及动态系统的分形维度估计具有重要意义。

递归神经网络中回拉吸引子的维度研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z

本研究聚焦于通过神经活动解码人类言语,帮助失去言语能力的瘫痪患者恢复沟通。研究表明,多模型集成方法显著提升了解码准确率,并优化了递归神经网络模型的训练过程,展示了在脑至文本算法准确性方面的持续进展。

Brain-to-Text Benchmark '24: Lessons Learned

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z
TDoC '24 第四天:深入探讨神经网络与Tacotron2文本到语音

深度学习是机器学习的一个子集,模仿人脑的信息处理方式。文章介绍了深度学习的基本概念,包括人工神经元、激活函数、序列模型及其架构,如卷积神经网络(CNN)和递归神经网络(RNN)。重点讨论了Tacotron2,一个简化的文本到语音系统,阐述了其架构和实现步骤。

TDoC '24 第四天:深入探讨神经网络与Tacotron2文本到语音

DEV Community
DEV Community · 2024-12-19T05:52:21Z

本研究提出了一种基于递归神经网络的抑郁情绪检测方法,针对社交媒体孟加拉文文本进行情感分析。通过对983条文本的预处理和特征提取,结果表明该方法能够有效识别抑郁情绪,为心理学家提供情感分析工具,帮助改善抑郁患者的生活。

Depression Detection from Social Media Bangla Text Using Recurrent Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-08T00:00:00Z

本研究提出了一种新计算框架,将递归神经网络与人类反应时间对齐,以更好地模拟人类行为选择。该框架优化了决策模型,实现了速度与准确性的平衡,显著提升了对人类反应时间数据的拟合效果。

RTify: Aligning Deep Neural Networks with Human Behavioral Decisions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z
液态人工智能如何挑战基于变换器的人工智能模型

液态神经网络(LNNs)是一种新型递归神经网络,能够有效处理序列数据,克服传统深度学习模型的灾难性遗忘和适应性不足。LNNs通过动态调整连接强度,保持对新信息的适应性并减少内存使用。液态基础模型(LFMs)基于LNNs,具有更高效率和性能,适用于多种数据类型,推动生成AI技术的发展。

液态人工智能如何挑战基于变换器的人工智能模型

The New Stack
The New Stack · 2024-11-03T15:00:22Z

本研究提出动态相似性分析(DSA),有效解决了现有指标在递归神经网络(RNN)表示分析中的不足。DSA在识别与行为相关的表示时具有更强的抗噪声能力,显著提升了对计算过程的理解和网络学习任务的揭示。

Dynamical Similarity Analysis Uniquely Captures the Development of Computations in Recurrent Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文探讨了深度强化学习在自动驾驶汽车竞速中的应用,结合迁移学习和递归神经网络,显著提升了AI代理在模拟环境中的表现,推动了自动驾驶技术的发展。

自动驾驶汽车竞速:深度强化学习的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究探讨递归神经网络(RNN)的外延性质,指出该领域存在重要空白。作者提出瑞斯定理,证明任何非平凡的RNN外延性质不可判定,揭示了判断RNN关键特性的困难,对理论研究和应用影响深远。

Extensional Properties of Recurrent Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究探讨了元强化学习在因果推理中的应用,训练递归神经网络进行无模型强化学习,证明其在新情境下进行因果推断和反事实预测的能力。研究提出了新的学习方法和算法,强调因果结构的快速适应性及其在复杂推理场景中的有效性,展示了因果模型的分类和识别方法的进展。

具备切换因果关系的系统:一种元因果视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

该研究探讨了机器学习架构在动态系统预测中的可迁移性。分析表明,神经门控和注意力机制能提升递归神经网络(RNN)的性能,而在变换器中引入递归概念效果不佳。结合递归高速公路网络的架构在高维时空预测中表现最佳。

Deconstructing Recurrence, Attention, and Gating: Investigating the Transferability of Transformers and Gated Recurrent Neural Networks in Dynamic System Forecasting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

该研究探讨了利用自监督学习和IMU传感器捕捉人类与狗的视角视频,以识别自传活动。提出了多模态数据集和基于递归神经网络的方法,旨在提高物体操纵行为的预测精度。此外,研究介绍了EgoGen合成数据生成器,以提供真实数据,解决增强现实中的人类运动模拟挑战。

HEADS-UP:用于盲人辅助系统的头戴式自我中心数据集以实现轨迹预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

神经算法推理(NAR)研究通过神经网络实现经典算法,展示了在复杂问题解决中的潜力。研究提出了CLRS算法推理基准,涵盖多种算法,并通过图神经网络和递归神经网络优化算法学习,显著提升了性能。

具有多种正确解的神经算法推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码