小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出ChordFormer,结合卷积神经网络与变换器,解决大词汇量音频和弦识别中的样本不足问题,提升了2%的帧级和6%的类别级准确率。

ChordFormer:一种基于Conformer架构的大词汇音频和弦识别方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究解决了联合训练和修剪过程中有效参数减少的问题,提出了一种基于自适应 dropout 层的修剪方法。该方法通过估计单元保留概率,识别出可被修剪的单元,并在 Conformer 的多个应用点进行了有效应用。研究结果显示,该方法在减少54%参数的同时,使识别精度提高约1%。

自适应 dropout 在收缩 Conformer 中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-06T00:00:00Z

我们提出了一种端到端的多通道说话人归属自动语音识别系统(MC-SA-ASR),结合了Conformer编码器和Transformer解码器。该系统在LibriSpeech数据集上实现了12%至16%的词错误率降低,并在AMI语料库中验证了其在真实会议转录中的有效性。

MSA-ASR:利用冻结的ASR模型进行高效多语种说话人归属

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

研究表明,通过预训练、自我训练和扩大模型规模,巨型ASR模型在少量标记数据下可实现先进性能。在34k小时的任务中,微调80亿参数的Conformer模型,仅用3%的数据达到先进水平。完整训练集提升性能,并在多个语音领域取得优异结果。

告别全秩:现代语音识别模型的低秩权重训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

该研究提出了一种新颖的方法,通过人工和自回归模型共同创建音频音轨的和声标注。研究者在自动产生和声预测后,人工稀疏地注释低模型置信度的部分,并根据人工指导调整模型的预测。研究者在流行音乐数据集上评估了该模型,并展示了人工参与的提升效果。

ChordSync:将和弦注释与音乐音频进行 Conformer 对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-01T00:00:00Z

本论文提出了一种名为Conformer的混合网络结构,利用卷积操作和self-attention机制进行增强表示学习。实验证明,Conformer在ImageNet上优于visual transformer(DeiT-B)2.3%,在MSCOCO上在目标检测和实例分割方面都优于ResNet-101,具有成为通用主干网络的潜力。

CTRL-F:通过多级特征交互和表示学习融合,在图像分类中将卷积与 Transformer 结合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

This paper was accepted at the Industry Track at NAACL 2024. With increasingly more powerful compute capabilities and resources in today’s devices, traditionally compute-intensive automatic speech...

Conformer-Based Speech Recognition on Extreme Edge-Computing Devices

Apple Machine Learning Research
Apple Machine Learning Research · 2024-06-18T00:00:00Z

我们引入了一种多任务Transformer模型CSLR2,可以在手语序列和口语文本之间输出联合嵌入空间,实现大词汇连续手语识别和手语检索。通过构建新的数据集注释,证明了同时训练模型进行CSLR和检索任务在性能上互相有益。利用BOBSL和英文字幕等大词汇数据集中的弱监督和嘈杂监督,我们的模型在两个任务上明显优于以往的最先进技术。

基于自适应的 Conformer 的连续手语识别与无监督预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-20T00:00:00Z

本论文介绍了一种名为Conformer的混合网络结构,利用卷积操作和self-attention机制进行增强表示学习。实验证明,Conformer在ImageNet上优于visual transformer(DeiT-B)2.3%,在MSCOCO上,在目标检测和实例分割方面都优于ResNet-101,具有成为通用主干网络的潜力。

LGFCTR: 图像匹配的局部和全局特征卷积变换器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z

该研究提出了一种使用关键帧的自注意力机制和下采样机制的方法,能够降低Conformer模型中自注意力机制的计算复杂度,并取得与基准模型相当或更高的性能。同时,该方法可以丢弃超过60%的无用帧,从而显著加速推断速度。

高效基于 Conformer 的端到端语音识别关键帧机制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

本文提出了一种紧凑的低维度特征表示方法,通过注意力池化层优化了ASR系统,实验结果表明在1000小时的语音语料上实现了显著降低的绝对词错误率。

增强记忆的 Conformer 模型用于改进端到端长篇音频转文字识别

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-22T00:00:00Z

本文介绍了一种名为HM-Conformer的音频深度伪造检测方法,采用分层池化和多级分类令牌聚合方法,能够有效地检测欺骗证据。在ASVspoof 2021 Deepfake数据集上的实验结果表明,HM-Conformer的等错误率为15.71%,表现竞争性能。

HM-Conformer: 带有分层汇聚和多级分类令牌聚合方法的基于 Conformer 的音频深度伪造检测系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-15T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码