小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在服务端用 Pion + FFmpeg + RNN 做 WebRTC 通话降噪

本文探讨了WebRTC服务端音频降噪实验,验证Go媒体服务能否通过Pion接收Opus音频并使用FFmpeg的RNN降噪滤镜处理。实验强调设备音频行为的不确定性,提出服务端降噪作为补充方案的价值。原型通过文件验证音频处理效果,未来需考虑实时转发的设计与挑战。

在服务端用 Pion + FFmpeg + RNN 做 WebRTC 通话降噪

实时互动网
实时互动网 · 2026-06-04T03:09:57Z
《GPT 图解》笔记:N-Gram、NPLM、LSTM

本文介绍了语言模型的发展历程,包括N-Gram、NPLM、RNN和LSTM等。N-Gram通过统计前n-1个词的概率进行预测,但缺乏泛化能力;NPLM引入词向量,具备一定的泛化能力;RNN和LSTM通过递归状态支持变长序列,解决了长期依赖问题。总结了N-Gram和Bag-of-Words的基本原理及应用。

《GPT 图解》笔记:N-Gram、NPLM、LSTM

Ying’s Blog
Ying’s Blog · 2026-05-10T08:00:35Z

神经网络通过前向传播、损失计算、反向传播和梯度下降进行训练。每个神经元执行线性打分和非线性激活,多个神经元组成层,层与层之间的非线性使网络能够拟合复杂函数。递归神经网络(RNN)通过引入状态,克服了多层感知器(MLP)在序列任务中的局限性。训练过程是参数在损失曲面上逐步优化的过程。

【Transformer 与注意力机制】08.5 神经网络基础:从 MLP 到 RNN 的最后一块地基

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-05-10T00:00:00Z

本文探讨了RNN(循环神经网络)与Transformer架构的演变。RNN面临长程依赖、梯度稳定和训练并行的三难问题,LSTM部分解决了梯度问题,但仍无法并行训练。2017年,Transformer通过完全依赖注意力机制解决了这三难,成为主流架构。尽管Transformer在长程依赖和并行性上表现优异,但其复杂度和内存消耗仍是局限。未来可能会出现结合循环结构的新模型,如Mamba和RWKV,以应对Transformer的不足。

【Transformer 与注意力机制】10 RNN 的根本局限:为什么需要 Transformer

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-15T00:00:00Z

本文探讨了循环神经网络(RNN)在处理变长序列中的应用及其局限性。RNN通过权重共享和记忆机制处理序列数据,但存在长程依赖、梯度消失和训练并行性等问题。LSTM和GRU作为RNN的变体,通过门控机制改善了这些问题。尽管RNN在早期自然语言处理和机器翻译中发挥了重要作用,但随着Transformer的出现,其应用逐渐减少。

【Transformer 与注意力机制】09 RNN 与序列建模:Transformer 之前的世界

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-15T00:00:00Z

本文讨论了学习Transformer时的常见误区,如过早追逐新论文、忽视RNN和误解注意力机制。强调基础知识的重要性,建议系统学习以更好地理解和应用Transformer架构。

【Transformer 与注意力机制】01|为什么要从这里开始

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-15T00:00:00Z
从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

该课程在freeCodeCamp.org YouTube频道上详细讲解了神经机器翻译的发展历程,包括RNN、LSTM和Seq2Seq模型的历史突破及其数学原理,并通过PyTorch实验帮助学习者逐步重建这些重要论文。

从零开始构建神经机器翻译 – PyTorch重现7篇重要论文

freeCodeCamp.org
freeCodeCamp.org · 2025-12-10T15:23:41Z
小猫都能懂的大模型原理 3 - 自注意力机制

本文介绍了大语言模型的自注意力机制,强调其通过并行计算Token间相似度,克服传统RNN模型的局限性。自注意力机制利用Query、Key和Value向量计算注意力权重,动态调整对其他词的关注,生成上下文向量。

小猫都能懂的大模型原理 3 - 自注意力机制

UsubeniFantasy
UsubeniFantasy · 2025-12-02T10:12:47Z

大模型架构正处于“后Transformer时代”的创新竞赛,重点在于Transformer的改进和非Transformer的探索。Attention机制和FFN层的优化是研究热点,而新型RNN架构逐渐成为主流。行业对架构创新的看法分为两派,未来主流架构需突破10B、20B和100B规模。

谁是大模型架构新王者? |量子位智库

量子位
量子位 · 2025-06-19T08:24:04Z
递归神经网络(RNN):全面指南

递归神经网络(RNN)是一种处理序列数据的神经网络,具备“记忆”功能,广泛应用于自然语言处理、机器翻译和情感分析等领域。长短期记忆(LSTM)网络解决了基本RNN的梯度消失问题,增强了对长距离依赖的捕捉能力。尽管RNN存在训练困难和计算开销大的缺点,但其在深度学习中的重要性持续上升。

递归神经网络(RNN):全面指南

DEV Community
DEV Community · 2025-05-05T09:49:49Z

本研究比较了深度学习与集成学习在交通预测中的应用,解决了短期预测模型的长期预测挑战。结果表明,时间嵌入显著提升了RNN的性能,而XGBoost在仅利用时间特征时也表现出色,为未来的长期交通预测研究提供了重要见解。

A Comparative Study of Deep Learning and Ensemble Learning in Traffic Forecasting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z
学习如何使用RNN和LSTM构建多类文本分类模型

多类文本分类是自然语言处理中的关键任务,RNN和LSTM模型用于处理文本序列。RNN适合顺序数据,但对长文本效果不佳;LSTM通过增强记忆能力解决此问题。构建分类器需收集标记数据、预处理文本、建立并训练模型。该技术广泛应用于情感分析和邮件分类等领域,提高了文本处理的准确性和效率。

学习如何使用RNN和LSTM构建多类文本分类模型

DEV Community
DEV Community · 2025-04-28T08:14:10Z

本研究分析了脉冲神经网络在序列建模中的记忆机制不足,提出了固定不应期脉冲神经网络架构,为生成稀疏脉冲模式提供了新的理论解释,对序列建模具有重要影响。

Revisiting Reset Mechanisms in Spiking Neural Networks for Sequential Modeling: Specialized Discretization for Binary Activated RNN

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
破解深度学习的密码:开发者和梦想者必读

深度学习是现代人工智能的核心,利用多层神经网络自动提取数据特征。主要架构包括卷积神经网络(CNN)、递归神经网络(RNN)和变换器模型。训练深度网络时需关注权重初始化、学习率和数据增强等因素。未来,深度学习将向可解释性和效率方向发展。

破解深度学习的密码:开发者和梦想者必读

DEV Community
DEV Community · 2025-04-18T11:17:46Z
破解深度学习的密码:开发者和梦想者必读

深度学习是现代人工智能的核心,利用多层神经网络自动学习复杂数据特征。主要架构包括卷积神经网络(CNN)、递归神经网络(RNN)和变换器模型。训练时需关注权重初始化、学习率和数据增强等因素。未来,深度学习将向可解释性和高效性发展。

破解深度学习的密码:开发者和梦想者必读

DEV Community
DEV Community · 2025-04-18T11:17:46Z

本研究提出平铺闪存线性注意力(TFLA)算法,旨在解决线性 RNN 在长序列建模中的计算效率和内存消耗问题。TFLA 通过序列并行化显著提升内核性能,实验结果表明其速度优于优化的闪存注意力,为高效长上下文序列建模设立了新标准。

Tiled Flash Linear Attention: More Efficient Linear RNN and xLSTM Kernels

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出SeqSAM方法,解决医学图像分割中仅生成单一预测的问题。该方法通过序列化和RNN启发策略,利用二部匹配损失确保分割掩模的临床相关性,并能生成多个掩模。研究表明,该方法在公开数据集上显著提高了分割质量。

SeqSAM: Autoregressive Multiple Hypothesis Prediction for Medical Image Segmentation Based on SAM

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-12T00:00:00Z

本研究提出了一种新型模型基础的强化学习算法,显著提高了样本效率。在Craftax-classic基准测试中获得67.4%的奖励,超越了DreamerV3和人类表现。该方法结合了CNN和RNN,并通过多项改进提升了模型性能。

Enhancing Transformer World Models for Data-Efficient Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本研究解决了低资源语言建模场景中对传统变换器模型的替代方案的需求。通过使用新提出的RNN架构HGRN2,实验结果表明,BABYHGRN在BLiMP、EWoK、GLUE和BEAR基准测试中超越了变换器模型,特别是在资源受限环境中,展示了RNN模型的可行性和潜在影响。

BabyHGRN:探索使用RNN进行语言模型的样本高效训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-20T00:00:00Z

本研究提出了一种名为SEKE的关键词提取新方法,结合RNN与DeBERTa模型,基于专家混合技术,提升了小规模语料的关键词提取能力和可解释性。实验结果表明,该方法在多个英文数据集上表现优异。

SEKE: Specialized Experts for Keyword Extraction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码