小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
【论文解读】BareWave:扔掉声码器,让 AI 语音复刻“一步到位”

BareWave是一种全波形原生的零样本语音合成技术,能够直接从文本和参考音频生成目标说话人的波形,无需中间声学表示或独立声码器。实验结果表明,其在内容清晰度和说话人相似度上表现优异,开辟了新的语音合成方向。

【论文解读】BareWave:扔掉声码器,让 AI 语音复刻“一步到位”

实时互动网
实时互动网 · 2026-07-02T03:30:21Z

清华大学与生数科技合作开发了音频超分辨率模型AudioLBM,能够将低采样率音频提升至192 kHz,显著改善音质。该模型基于桥类生成模型,采用隐空间建模,提升了音频生成的效率与质量,推动了音频超分领域的发展。

清华大学生数科技:从波形到隐空间,AudioLBM引领音频超分新范式

量子位
量子位 · 2025-10-12T04:23:18Z
基于波形域神经网络的Ambisonics超分辨率

本文介绍了一种基于卷积时间域音频神经网络(Conv-TasNet)的数据驱动空间音频解决方案,能够将一阶Ambisonics(FOA)输入转换为高阶Ambisonics(HOA)输出。该方法在空间准确性上优于传统渲染器,量化评估显示预测与实际第三阶HOA之间的平均位置均方误差为0.6dB,感知质量提高了80%。

基于波形域神经网络的Ambisonics超分辨率

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-04T00:00:00Z
python脚本下载连续波形数据更新

该脚本下载指定时间段的LH分量数据,按天保存,避免重复下载。处理数据时去除仪器响应,确保保存LHZ、LHE、LHN分量,并进行补零处理,最终以SAC格式保存。

python脚本下载连续波形数据更新

seisamuse
seisamuse · 2025-06-08T12:42:13Z
python脚本下载连续波形数据

该脚本用于下载2013至2024年的地震台站数据,保存为MSEED格式,处理过程中去除仪器响应,并记录下载时间和错误日志。通过多线程提高下载效率,并支持重试机制。

python脚本下载连续波形数据

seisamuse
seisamuse · 2025-06-07T09:09:37Z

本研究解决了在无线通信中对多任务的需求不足的问题,提出了一种名为WavesFM的新型无线基础模型架构。该模型通过共享的视觉变换器骨干网和特定任务的多层感知器头部结合低秩适配(LoRA)进行高效微调,显著优化计算和内存性能,并展示了在多个下游任务上的出色泛化能力。研究结果表明,该模型在多个通信和感知任务中实现了优异的性能,并表明基础模型在未来6G网络中的变革潜力。

6G波形基础模型:用于感知、通信和定位的创新框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-18T00:00:00Z

本文研究了在深度学习框架中引入伪谱方法以改进全波形反演(FWI)的可能性,解决了在复杂环境下传统反演方法的局限性。通过将伪谱FWI问题重新表述为深度学习算法,提出了一种新颖的递归神经网络(RNN)框架,实验证明该方法在准确性和稳定性上优于经典FWI,具有更好的故障识别能力和低频内容。

基于理论指导的pseudo-spectral全波形反演通过深度神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z

本研究解决了在复杂环境中进行全波形反演(FWI)时面临的求解器选择和数据不足等问题。通过将伪谱FWI问题重新形式化为深度学习算法,提出了一种新颖的深度神经网络框架。研究发现,这种数据驱动的伪谱反演方法在更深和滑脱区域的表现优于传统FWI,具有更好的全局逼近能力。

基于数据驱动的伪谱全波形反演与深度神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z

本研究探讨了深度学习与全波形反演结合的潜力,以解决地震成像与地下特征表征中的数据质量和模型复杂性问题。通过提出混合、生成和物理指导模型,研究显示这种协同方法能显著提高地下属性估计的准确性、效率和可靠性,对地球物理学领域产生变革性影响。

深度学习与全波形反演的协同作用:数据驱动与理论指导方法结合以增强地震成像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-24T00:00:00Z

本文介绍了一种新型音频编解码器及其在语音合成中的应用,提出了自监督学习、源解耦技术和低帧率编解码器等多种改进方法,显著提升了语音合成的可懂性和效率,解决了传统模型的不足。

对神经编解码再合成的深入研究:缩小编解码与波形生成之间的差距

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

文章介绍了如何用Julia语言和Plots包生成正弦波图,并保存为.png文件。程序设置采样率、持续时间和频率,生成时间向量和正弦波信号,然后绘制并保存为"sine_wave.png"。

Julia - 简单波形绘制

DEV Community
DEV Community · 2024-10-18T12:34:56Z

本文探讨了多种基于卷积神经网络的可解释性方法,包括归因技术、梯度和属性算法,以及新提出的CRAFT方法。实验结果表明,这些方法在解释准确度和视觉质量上优于现有技术,并且具有良好的稳定性。此外,研究还提出了新的显著性地图方法和评估指标,以提高模型的可解释性和用户信任。

一个波形解释所有:后期解释的统一视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本文介绍了机器学习在光通信和网络中的应用,涵盖网络数据分析和故障管理等研究进展。尽管相关研究逐渐增多,应用仍处于初期阶段。提出了多种方法,如基于物理的机器学习模型、异常检测和深度学习模型,以提高光网络的监测和故障诊断准确性,并探讨未来的研究方向。

利用MIMO数字光纤传感、波形和机器学习对部署的光网络进行威胁分类

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-05T00:00:00Z
突破音频质量障碍:引入 PeriodWave-Turbo 实现高效波形合成

韩国研究人员开发了名为PeriodWave-Turbo的模型,旨在加快音频合成速度,保持音频质量。该模型通过简化步骤,减少了创建高保真音频所需的时间。使用预先训练的条件流匹配(CFM)模型和固定采样方法,只需2到4个步骤即可生成波形。PeriodWave-Turbo在LibriTTS数据集上获得高语音质量评估分数。通过加入重建损失和多周期多尺度判别器等技术,提高了音频质量和训练过程的稳定性。该模型为高保真波形生成提供了解决方案,并为实时音频应用带来了希望。

突破音频质量障碍:引入 PeriodWave-Turbo 实现高效波形合成

实时互动网
实时互动网 · 2024-08-20T09:46:25Z

本文调研了时间序列数据增强技术及其在神经网络分类中的应用,提出多种方法并进行了实证评估。研究表明,数据增强显著提高模型准确度,尤其在数据稀缺情况下。通过小波分析和新颖网络结构,探索了多变量时间序列模型的性能,强调多样化增强策略的重要性。

波形掩码/混合:探索基于小波的时间序列预测增强

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-20T00:00:00Z

蛙蛙写作是一款AI产品,已有30万注册用户,每日使用时长达6.5小时。它提供创作全流程的工具,包括拆书、头脑风暴、模板等功能。蛙蛙支持剧本和视频生成,用户可以参与创作的每个环节,保护隐私。蛙蛙使用个性化私人模型LPA,学习用户使用习惯,做个性化生成。波形智能希望实现每个人都拥有一个能“越来越懂你”的私人语言模型。

在蛙蛙写作,用户每天用6.5小时来创作|对话波形智能

量子位
量子位 · 2024-08-17T07:06:10Z

本文研究了语音合成技术,采用先进的机器学习方法克服传统模型的局限性。生成对抗网络(GAN)和自回归模型在评估中优于循环神经网络。研究提出了Parallel WaveGAN和DiffWave等新型模型,显著提高了音频生成的质量和效率,展现了良好的应用潜力。

通过对抗流匹配优化加速高保真波形生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本文探讨了基于深度学习的地震速度反演方法,提出了SVInvNet模型,该模型采用增强型编码器-解码器结构,能够有效处理复杂信息。研究表明,SVInvNet在不同规模的数据集上表现优异,尤其在噪声和复杂模型处理方面,性能超过传统方法。

反演-深度操作网络:基于深度操作网络的编码-解码新网络用于全波形反演

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-15T00:00:00Z

本文介绍了多种基于生成模型的高质量语音合成方法,如WaveGlow、Parallel WaveGAN和DiffWave。这些模型通过优化算法和新结构,能够高效生成高保真音频,且在速度和质量上优于传统方法,显示出在语音合成和音乐生成中的显著优势。

周期波:高保真波形生成的多周期流匹配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-14T00:00:00Z

波形智能发布了蛙蛙写作2.0,使用AI协助创作小说、剧本和视频。他们还发布了个性化私人模型LPA,能够学习创作者的习惯和风格。波形智能CEO姜昱辰和CPO万磊将在8月1日19:00参加直播,讨论AI与创作者的关系。

AI加持创作,「小说-剧本-视频」只需一人全搞定|对话波形智能

量子位
量子位 · 2024-08-01T03:59:33Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码