小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ParaRNN:解锁大型语言模型的非线性递归神经网络的并行训练

ParaRNN是一个新框架,突破了非线性递归神经网络(RNN)的序列并行化限制。它通过将非线性递归关系转化为单一方程组,并利用牛顿迭代法进行并行求解,实现了高达665倍的速度提升。该框架支持训练7B参数的LSTM和GRU模型,表现出与同规模的Transformer相当的困惑度。ParaRNN的开源代码库将促进高效序列建模的研究。

ParaRNN:解锁大型语言模型的非线性递归神经网络的并行训练

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-16T00:00:00Z

该研究提出了VRU-CIPI框架,旨在提高城市交叉口脆弱道路用户(VRU)的过马路意图预测准确性。通过GRU和多头Transformer自注意力机制,该方法在UCF-VRU数据集上实现了96.45%的准确率,显著增强了交叉口安全性。

VRU-CIPI: Crossing Intention Prediction at Intersections to Enhance Vulnerable Road User Safety

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出了一种基于简化门控递归单元(GRU)的硬件架构,旨在解决内存受限的嵌入式边缘计算中的时间序列数据处理问题。通过开关电容电路实现内存计算和门控状态更新,显著提升了性能,并验证了与软件模型的兼容性。

MINIMALIST: Switched-Capacitor Circuits for Efficient In-Memory Computation of Gated Recurrent Units

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种推测性谈话结束检测器,解决了对话系统中用户发言结束与犹豫的区分问题。通过结合GRU和Wav2vec模型,显著提高了检测准确性,实现实时检测,改善了语音对话系统的响应流畅性,提升了用户体验。

Speculative End-Turn Detector for Efficient Speech Chatbot Assistant

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-30T00:00:00Z

本研究提出了一种基于注意力机制的双向GRU混合模型,用于检测乌尔都语中的不当内容。该模型在未使用预训练word2Vec层的情况下,达到了84%的准确率,表明注意力层显著提高了效率。

Application of Attention-Based Bidirectional GRU Hybrid Model in Urdu Inappropriate Content Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z
第8部分:构建自己的人工智能 - 用于序列数据的递归神经网络(RNN)

递归神经网络(RNN)用于处理序列数据,具备记忆能力。其变体LSTM和GRU解决了基本RNN的梯度消失和爆炸问题,广泛应用于语言建模、情感分析和时间序列预测等领域。

第8部分:构建自己的人工智能 - 用于序列数据的递归神经网络(RNN)

DEV Community
DEV Community · 2024-12-13T05:29:55Z

本研究解决了金融市场情绪分析中的时间序列数据的顺序依赖和长期依赖问题。通过结合卷积神经网络和门控循环单元,进行情绪状态的特征提取和时间序列分析,从而实现准确的风险预警。研究表明,该方法能够有效识别市场情绪变化,提高风险预测的精准性。

基于CNN和GRU的金融市场情绪整合分析用于风险预测和预警系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-13T00:00:00Z

本研究提出了一种基于GRU的多目标跟踪方法,解决了传统方法在复杂环境中的非线性和噪声建模不足问题。通过可学习的卡尔曼滤波器和半监督学习策略,提升了模型性能和鲁棒性。实验结果表明,该方法在nuScenes和Argoverse2数据集上优于传统方法。

基于半监督GRU-卡尔曼滤波器的3D多目标跟踪

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z
现代序列处理入门:第一部分:深入了解递归神经网络

本文介绍了递归神经网络(RNN)的基本概念及其在深度学习中的重要性。RNN能够记忆过去的输入,捕捉序列数据中的模式,广泛应用于自然语言处理等领域。然而,RNN在处理长序列时面临梯度消失等问题,因此出现了长短期记忆(LSTM)和门控循环单元(GRU)等改进架构。最后,文章强调了Transformer模型在序列处理中的高效性。

现代序列处理入门:第一部分:深入了解递归神经网络

DEV Community
DEV Community · 2024-10-27T22:41:15Z

研究提出了一种层次模型,用于预测氮氧化物、臭氧和细颗粒物浓度。模型基于空气污染动态和大气科学,使用层次化的GRU,预测效果优异。

深度学习预测雾霾云

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本研究重新评估传统RNN,如LSTM和GRU,提出通过消除隐藏状态依赖的新方法。简化版(minLSTMs和minGRUs)减少参数,训练可完全并行化,效率提升175倍,性能与最新序列模型相当。

递归神经网络是我们所需的一切吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z
PyTorch中的GRU

文章介绍了GRU层的初始化参数和使用方法。GRU可以处理2D或3D张量。初始化参数包括输入大小、隐藏层大小、层数、偏置、批处理优先、丢弃率、双向、设备和数据类型等。示例代码展示了如何在PyTorch中使用GRU进行张量计算,并解释了各参数的作用和默认值。

PyTorch中的GRU

DEV Community
DEV Community · 2024-09-29T18:32:35Z
理解循环神经网络(RNN)

循环神经网络(RNN)是一种处理序列数据的神经网络,适用于时间序列和自然语言处理。RNN通过更新隐藏状态捕捉信息,但训练时可能遇到梯度消失或爆炸问题。长短期记忆(LSTM)和门控循环单元(GRU)解决了这些问题。尽管有局限性,RNN仍是序列建模的重要工具。

理解循环神经网络(RNN)

DEV Community
DEV Community · 2024-09-25T16:20:56Z

本研究评估了机器学习模型在预测新材料性能时的表现,发现当前最先进的图神经网络算法在超出分布的任务上表现不足。研究还发现CGCNN、ALIGNN和DeeperGATGNN等模型在超出分布的任务上性能更稳健,并提供了改进性能的见解。

智能数据驱动的GRU预测器用于SnO$_2$薄膜特性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本研究利用图神经网络混合模型提高了野火预测准确性,揭示了野火相关性聚类和特征重要性,推动了野火预测方法的发展。

利用LSTM和GRU建模亚马逊地区火灾的神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

通过深度学习构建融合多通道数据的网络(MCDFN),提高需求预测准确性并实现可解释性,优于其他七个深度学习模型,适用于供应链管理系统且为未来研究提供方向。

MCDFN:供应链需求预测通过可解释的多通道数据融合网络模型整合 CNN、LSTM 和 GRU

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-24T00:00:00Z

本文介绍了一种新的方法,使用四足机器人帮助视力障碍者在现实世界中导航。该方法可以让四足机器人检测湿滑的表面,并使用音频和触觉反馈告知用户何时停下来。提出了一种精度为99.925%的最先进的基于GRU的神经网络架构。数据集和代码已发布到公共领域中。

DogSurf: 四足机器人用于视障人士导航的基于 GRU 的地面识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-05T00:00:00Z

DeFlow是一种用于场景流任务的网络,通过使用GRU细化从基于体素的特征到点特征的过渡,并通过新型损失函数解决了数据不平衡问题。在大规模点云数据上,DeFlow取得了最先进的结果,具有更好的性能和效率。

DeFlow: 自动驾驶场景流解码器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-29T00:00:00Z

本文比较了不同类型的递归神经网络中的递归单元,发现实现门机制的更加复杂的递归单元比传统的 tanh 单元更好,特别是长短时记忆(LSTM)单元和门控循环单元(GRU)表现最佳。

延迟记忆单元:通过延迟门建模时间依赖

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

该论文介绍了一种将传统的 Black and Scholes 模型与人工智能算法相结合的 Q-Learning Black Scholes 方法,实现了无模型、数据驱动的期权定价和对冲。该算法在不同场景下表现出稳健的性能,并考虑了比例交易成本。

使用自注意 GRU 和斯哈普利值解释的美式期权定价

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码