小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ParaRNN:解锁大型语言模型的非线性递归神经网络的并行训练

ParaRNN是一个新框架,突破了非线性递归神经网络(RNN)的序列并行化限制。它通过将非线性递归关系转化为单一方程组,并利用牛顿迭代法进行并行求解,实现了高达665倍的速度提升。该框架支持训练7B参数的LSTM和GRU模型,表现出与同规模的Transformer相当的困惑度。ParaRNN的开源代码库将促进高效序列建模的研究。

ParaRNN:解锁大型语言模型的非线性递归神经网络的并行训练

Apple Machine Learning Research
Apple Machine Learning Research · 2026-01-16T00:00:00Z
时间序列中的Transformer与LSTM:哪种效果更好?

本文探讨了使用LSTM和Transformer模型进行单变量时间序列预测。通过分析芝加哥公共交通数据,展示了数据预处理、模型训练和评估的过程。结果表明,两种模型的预测性能相似,Transformer略优。建议尝试不同数据集以观察模型表现的差异。

时间序列中的Transformer与LSTM:哪种效果更好?

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-15T11:00:36Z
从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

该课程在freeCodeCamp.org YouTube频道上详细讲解了神经机器翻译的发展历程,包括RNN、LSTM和Seq2Seq模型的历史突破及其数学原理,并通过PyTorch实验帮助学习者逐步重建这些重要论文。

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

freeCodeCamp.org
freeCodeCamp.org · 2025-12-10T15:23:41Z

LSTM之父Schmidhuber质疑何恺明是残差学习的奠基人,指出早在1991年,Hochreiter已提出循环残差连接以解决梯度消失问题。他认为ResNet等深度学习成果应归功于早期研究,争论已持续多年。

LSTM之父向何恺明开炮:我学生才是残差学习奠基人

量子位
量子位 · 2025-10-19T14:49:10Z
构建一个简单的序列到序列(Seq2Seq)模型用于语言翻译

本文介绍了如何构建和训练基于LSTM的序列到序列(seq2seq)模型,用于英语到法语的翻译。模型采用编码器-解码器架构,编码器处理输入序列生成上下文向量,解码器基于该向量生成输出序列。文章详细讲解了数据集准备、模型实现、训练过程及改进方法,并强调了注意力机制的重要性。

构建一个简单的序列到序列(Seq2Seq)模型用于语言翻译

MachineLearningMastery.com
MachineLearningMastery.com · 2025-07-22T02:27:18Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化爬取流程。

LSTM之父22年前构想将成真?一周内AI「自我进化」论文集中发布,新趋势涌现?

机器之心
机器之心 · 2025-06-02T14:46:42Z

京东科技提出了一种基于LSTM网络的无阈值时间序列异常检测方法,结合基线模块和无监督检测模块,实现高效准确的异常分析,克服了传统阈值设定的局限性,适应性强,适用于不同周期和动态变化的场景,实践验证效果显著。

提高IT运维效率,深度解读京东云AIOps落地实践(异常检测篇)

京东科技开发者
京东科技开发者 · 2025-05-22T08:17:24Z
递归神经网络(RNN):全面指南

递归神经网络(RNN)是一种处理序列数据的神经网络,具备“记忆”功能,广泛应用于自然语言处理、机器翻译和情感分析等领域。长短期记忆(LSTM)网络解决了基本RNN的梯度消失问题,增强了对长距离依赖的捕捉能力。尽管RNN存在训练困难和计算开销大的缺点,但其在深度学习中的重要性持续上升。

递归神经网络(RNN):全面指南

DEV Community
DEV Community · 2025-05-05T09:49:49Z
学习如何使用RNN和LSTM构建多类文本分类模型

多类文本分类是自然语言处理中的关键任务,RNN和LSTM模型用于处理文本序列。RNN适合顺序数据,但对长文本效果不佳;LSTM通过增强记忆能力解决此问题。构建分类器需收集标记数据、预处理文本、建立并训练模型。该技术广泛应用于情感分析和邮件分类等领域,提高了文本处理的准确性和效率。

学习如何使用RNN和LSTM构建多类文本分类模型

DEV Community
DEV Community · 2025-04-28T08:14:10Z

本研究提出了一种名为HybridoNet-Adapt的框架,用于准确预测锂离子电池的剩余使用寿命(RUL)。该方法结合特征提取、去噪和归一化,利用LSTM和神经常微分方程块,显著提高了预测的可靠性,实验结果表明其优于现有技术,具有重要的实际应用价值。

HybridoNet-Adapt: A Domain Adaptation Framework for Accurate Prediction of Remaining Useful Life of Lithium-Ion Batteries

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-27T00:00:00Z

该研究提出了一种新方法,利用有限视图推断抓取策略,结合LSTM单元的循环生成对抗网络(R-GAN),实现了89%的准确率。

Volume Reconstruction Based on Partial Views for Task-Oriented Grasping

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
掌握时间序列预测:从ARIMA到LSTM

本文探讨了时间序列预测的三种主要方法:自回归积分滑动平均(ARIMA)、指数平滑时间序列(ETS)和长短期记忆网络(LSTM)。ARIMA适用于稳定数据,ETS适合具有周期性的数据,而LSTM则利用深度学习捕捉复杂模式,适合处理序列数据。这些方法有助于优化资源配置和降低运营风险。

掌握时间序列预测:从ARIMA到LSTM

MachineLearningMastery.com
MachineLearningMastery.com · 2025-03-12T11:00:00Z

本研究提出了AP-pVAD模型,结合NPQ与LSTM-Transformer,解决了pVAD脉动控制中的关键问题。结果表明,该模型在压力和脉动时间预测上误差较低,具有良好的有效性和稳定性,对pVAD的临床应用具有重要意义。

LSTM-Transformer Model for pVAD Pulsation Control

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本文介绍了N-gram模型和Word2Vec的基本概念。N-gram模型用于计算句子概率,捕捉短语结构和上下文关系,但存在局限性。Word2Vec通过降低维度和赋予词语语义信息,解决了传统one-hot编码的问题,提升了词与词之间的关联性,并展示了其训练过程及在文本分类中的应用。

Word2Vec+LSTM+Attention恶意评论识别

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-03-02T11:02:52Z

本文介绍了N-gram模型和Word2Vec的基本概念。N-gram模型用于计算句子概率,捕捉短语结构和上下文关系,但存在局限性。Word2Vec通过降维和赋予词语语义信息,解决了传统one-hot编码的问题,增强了词与词之间的关联性。结合LSTM和自注意力机制,进一步提升了模型性能。

Word2Vec+LSTM+Attention恶意评论识别

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-03-02T11:02:52Z

本研究解决了文本情感分析中对电影评论进行细粒度分类的准确性缺口。通过结合预训练的BERT模型与双向LSTM,我们的创新方法显著提升了二元和细粒度情感分类的性能,并通过实施SMOTE和NLPAUG技术增强模型的泛化能力。我们的方法在IMDb数据集上的二元分类准确率达到97.67%,在SST-5数据集上的五分类准确率为59.48%,均超越了当前最先进的模型。

使用双向LSTM微调BERT以进行细粒度电影评论情感分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-28T00:00:00Z

本研究探讨了随机共振现象在深度学习模型中对低对比度图像检测的改善效果。通过在LSTM递归神经网络中引入噪声,显著提升了对弱信号的检测能力,展现了改善图像分类性能的潜力。

Stochastic Resonance Improves the Detection of Low Contrast Images in Deep Learning Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本文提出了一种结合CNN和LSTM的超声视频分类方法,解决了现有关键帧分类在时间序列特征提取方面的不足。该方法在F1分数和特异性上显著提升,验证了其在变帧超声视频分类中的有效性,并暗示了在其他医学成像中的应用潜力。

Variable Frame-Based CNN-LSTM Classification of Ultrasound Video Breast Nodules

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出了一种新型时空再分析模型AQ-Net,旨在改善空气质量预测中的空间泛化问题。AQ-Net结合了LSTM和多头注意力机制,利用循环编码和神经kNN技术,实现更精细的空气质量估计。实验结果表明,该模型在空气质量再分析中表现优越,能够有效捕捉城市环境动态。

Deep Spatio-Temporal Neural Network for Air Quality Reanalysis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究利用长短期记忆(LSTM)网络预测标准普尔500指数,克服了传统模型在处理非线性依赖方面的不足。结果表明,LSTM在捕捉依赖性和预测准确性上优于ARIMA模型,展示了深度学习在金融数据处理中的潜力。

Predicting the S&P 500 Index Using LSTM Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码