小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

神经网络通过前向传播、损失计算、反向传播和梯度下降进行训练。每个神经元执行线性打分和非线性激活,多个神经元组成层,层与层之间的非线性使网络能够拟合复杂函数。递归神经网络(RNN)通过引入状态,克服了多层感知器(MLP)在序列任务中的局限性。训练过程是参数在损失曲面上逐步优化的过程。

【Transformer 与注意力机制】08.5 神经网络基础:从 MLP 到 RNN 的最后一块地基

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-10T00:00:00Z
ParaRNN:大规模非线性递归神经网络,可并行训练

苹果研究人员提出了ParaRNN框架,显著提高了非线性递归神经网络(RNN)的训练效率,实现了大规模并行训练。该方法使得7亿参数的RNN在语言建模任务中表现出与变换器相当的性能,且通过引入牛顿法,ParaRNN在保持非线性表达能力的同时实现了高效的并行计算。这一进展为RNN的广泛应用和进一步研究提供了新的可能性。

ParaRNN:大规模非线性递归神经网络,可并行训练

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-23T00:00:00Z
苹果在ICLR 2026的机器学习研究

苹果在ICLR 2026会议上展示了多项机器学习研究,包括高效的递归神经网络训练、状态空间模型工具、统一的多模态模型Manzano,以及蛋白质折叠的新方法SimpleFold。这些研究旨在推动AI和ML领域的进步,并支持相关社区。

苹果在ICLR 2026的机器学习研究

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-22T00:00:00Z

递归神经网络(RNN)用于处理序列数据,具备内部状态(记忆),适应多种输入输出结构。RNN通过递归公式更新隐藏状态并生成输出。长短期记忆(LSTM)通过门控机制解决梯度消失问题,增强信息流动。

CS231n 讲义 VII:递归神经网络

Louis Aeilot's Blog
Louis Aeilot's Blog · 2026-04-07T13:30:09Z

本研究提出了一种层次稀疏注意力(HSA)机制,解决了递归神经网络(RNN)在随机访问历史上下文方面的局限性。结合HSA与Mamba形成的RAMba在6400万上下文中实现了完美的密码检索准确率,展示了其在长上下文建模中的潜力。

Random Long-Context Access for Mamba via Hardware-aligned Hierarchical Sparse Attention

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究提出了一种新的递归神经网络机制Lattice,旨在降低序列学习中注意力机制的计算复杂性。Lattice通过利用K-V矩阵的低秩结构高效压缩内存,显著减少计算复杂度。实验结果表明,Lattice在不同上下文长度下的表现优于现有方法,尤其在上下文长度增加时,性能提升更为明显。

Lattice: Learning to Efficiently Compress Memory

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-08T00:00:00Z

《百页语言模型书》由安德里·布尔科夫撰写,旨在帮助读者理解大型语言模型(LLM)。书中涵盖机器学习基础、语言模型原理、递归神经网络、变换器模型及现代LLM的影响,适合初学者和专业人士,提供深入的技术基础,助力人工智能领域的学习与应用。

《百页语言模型书:大型语言模型的精彩技术入门》

KDnuggets
KDnuggets · 2025-03-13T14:00:47Z

本研究探讨了递归神经网络(RNN)在序列数据学习中的维度问题,提出了一种非自治动态系统方法,建立了状态空间子集的分形维度上限。当输入序列来自N维可逆动态系统时,该子集的分形维度上限为N。这一结果对RNN的维度减少及动态系统的分形维度估计具有重要意义。

递归神经网络中回拉吸引子的维度研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z

本研究聚焦于通过神经活动解码人类言语,帮助失去言语能力的瘫痪患者恢复沟通。研究表明,多模型集成方法显著提升了解码准确率,并优化了递归神经网络模型的训练过程,展示了在脑至文本算法准确性方面的持续进展。

Brain-to-Text Benchmark '24: Lessons Learned

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-23T00:00:00Z
TDoC '24 第四天:深入探讨神经网络与Tacotron2文本到语音

深度学习是机器学习的一个子集,模仿人脑的信息处理方式。文章介绍了深度学习的基本概念,包括人工神经元、激活函数、序列模型及其架构,如卷积神经网络(CNN)和递归神经网络(RNN)。重点讨论了Tacotron2,一个简化的文本到语音系统,阐述了其架构和实现步骤。

TDoC '24 第四天:深入探讨神经网络与Tacotron2文本到语音

DEV Community
DEV Community · 2024-12-19T05:52:21Z

本研究提出了一种基于递归神经网络的抑郁情绪检测方法,针对社交媒体孟加拉文文本进行情感分析。通过对983条文本的预处理和特征提取,结果表明该方法能够有效识别抑郁情绪,为心理学家提供情感分析工具,帮助改善抑郁患者的生活。

Depression Detection from Social Media Bangla Text Using Recurrent Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-08T00:00:00Z

本研究提出了一种新计算框架,将递归神经网络与人类反应时间对齐,以更好地模拟人类行为选择。该框架优化了决策模型,实现了速度与准确性的平衡,显著提升了对人类反应时间数据的拟合效果。

RTify: Aligning Deep Neural Networks with Human Behavioral Decisions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-06T00:00:00Z
液态人工智能如何挑战基于变换器的人工智能模型

液态神经网络(LNNs)是一种新型递归神经网络,能够有效处理序列数据,克服传统深度学习模型的灾难性遗忘和适应性不足。LNNs通过动态调整连接强度,保持对新信息的适应性并减少内存使用。液态基础模型(LFMs)基于LNNs,具有更高效率和性能,适用于多种数据类型,推动生成AI技术的发展。

液态人工智能如何挑战基于变换器的人工智能模型

The New Stack
The New Stack · 2024-11-03T15:00:22Z

本研究提出动态相似性分析(DSA),有效解决了现有指标在递归神经网络(RNN)表示分析中的不足。DSA在识别与行为相关的表示时具有更强的抗噪声能力,显著提升了对计算过程的理解和网络学习任务的揭示。

Dynamical Similarity Analysis Uniquely Captures the Development of Computations in Recurrent Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文探讨了深度强化学习在自动驾驶汽车竞速中的应用,结合迁移学习和递归神经网络,显著提升了AI代理在模拟环境中的表现,推动了自动驾驶技术的发展。

自动驾驶汽车竞速:深度强化学习的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究探讨递归神经网络(RNN)的外延性质,指出该领域存在重要空白。作者提出瑞斯定理,证明任何非平凡的RNN外延性质不可判定,揭示了判断RNN关键特性的困难,对理论研究和应用影响深远。

Extensional Properties of Recurrent Neural Networks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-30T00:00:00Z

本研究探讨了元强化学习在因果推理中的应用,训练递归神经网络进行无模型强化学习,证明其在新情境下进行因果推断和反事实预测的能力。研究提出了新的学习方法和算法,强调因果结构的快速适应性及其在复杂推理场景中的有效性,展示了因果模型的分类和识别方法的进展。

具备切换因果关系的系统:一种元因果视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

该研究探讨了机器学习架构在动态系统预测中的可迁移性。分析表明,神经门控和注意力机制能提升递归神经网络(RNN)的性能,而在变换器中引入递归概念效果不佳。结合递归高速公路网络的架构在高维时空预测中表现最佳。

Deconstructing Recurrence, Attention, and Gating: Investigating the Transferability of Transformers and Gated Recurrent Neural Networks in Dynamic System Forecasting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

该研究探讨了利用自监督学习和IMU传感器捕捉人类与狗的视角视频,以识别自传活动。提出了多模态数据集和基于递归神经网络的方法,旨在提高物体操纵行为的预测精度。此外,研究介绍了EgoGen合成数据生成器,以提供真实数据,解决增强现实中的人类运动模拟挑战。

HEADS-UP:用于盲人辅助系统的头戴式自我中心数据集以实现轨迹预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

神经算法推理(NAR)研究通过神经网络实现经典算法,展示了在复杂问题解决中的潜力。研究提出了CLRS算法推理基准,涵盖多种算法,并通过图神经网络和递归神经网络优化算法学习,显著提升了性能。

具有多种正确解的神经算法推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码