小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
音调重音检测提升了预训练自动语音识别的性能

本文介绍了一种联合自动语音识别(ASR)和音调重音检测模型,显著提升了ASR系统的性能。音调重音检测模块使F1-score提高41%,并在LibriSpeech数据集上将错误率降低28.3%。研究强调了扩展预训练语音模型以保留重要韵律线索的必要性。

音调重音检测提升了预训练自动语音识别的性能

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-15T00:00:00Z
如何使用Web音频API在浏览器中生成和控制声音

Web音频API是一个强大的工具,允许开发者在浏览器中直接创建和控制声音。通过JavaScript,可以生成音调、控制音量、实现交互式声音以及调节音高和时序。开发者可利用此API进行音频创作。

如何使用Web音频API在浏览器中生成和控制声音

DEV Community
DEV Community · 2025-04-18T09:12:25Z

本研究提出了一种新颖的ProsodyFM模型,旨在改善语音合成在短语和音调方面的不足。该模型通过短语断点和终端音调编码器,提高了语音的可懂性和对复杂句子的适应能力。

ProsodyFM: Unsupervised Phrase and Pitch Control for Enhanced Understandability in Speech Synthesis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-16T00:00:00Z

本研究针对现有语音实地工作中手动操作造成的时间和财务成本的挑战,提出了基于音高的音调相似性表征方法Tone2Vec。通过Tone2Vec,研究开发了首个自动化的音调转录与聚类方法,并将其整合为一个易用的开源包ToneLab,显著提升了对音调语言的实地考察和跨区域分析的效率。

自动音调转录与聚类:Tone2Vec

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

声调是上海方言韵律的关键组成部分,研究发现单词分割可以提高语音合成模型中声调变调的质量,上海方言应被视为独立的语言。

基于语料库的对话台湾普通话单音节词音调轮廓的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z

本研究探讨了无监督文本到语音合成作为数据增强方法,以改进口音语音识别的应用。通过生成带有口音的语音数据,并与无口音数据结合,可以减小字错误率。

跨方言语音合成中的音调重音语言结合多方言音素级BERT

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z
我们是否对电动车的声音想得太复杂了?

一项新调查显示,大多数人更喜欢电动汽车发出类似传统汽车的声音,而不是现有的无机声音。调查还发现,非音调声音更受欢迎,被认为更像白噪音或“自然衍生”的声音。政府规定电动汽车需要发出低速声音以警示行人和其他道路使用者,但这些音调声音常常带来负面影响。

我们是否对电动车的声音想得太复杂了?

The Verge
The Verge · 2024-06-20T15:59:59Z

音频开发中常用的概念包括音调、音色、响度、采样率、采样精度和声道数。声音可以转换为正弦波表示,音调和响度由基波决定,音色由谐波决定。数字音频需要关注采样率、采样精度和声道数。音频数据可以进行无损压缩和有损压缩,常见的压缩算法有FLAC、ALAC、APE和MP3。AAC是MP3的升级版,具有更好的采样率、采样精度和声道数。

移动开发中关于音频的基本概念

六虎
六虎 · 2024-04-14T04:52:44Z

本文介绍了使用JavaScript实现音频倍速合成的方法,包括解决变速后音调变化的问题和改进的算法实现。作者提供了两个项目链接,分别是timestretch和OLA-TS.js,后者效果更好。文章还提到了其他与音频时间速率和音调相关的项目,并表示将在下篇文章中继续讨论。

不改变音调情况下Audio音频的倍速合成JS实现

张鑫旭-鑫空间-鑫生活
张鑫旭-鑫空间-鑫生活 · 2024-02-29T14:22:22Z

研究人员提出了两种新的TTS方法:Diff-LM-Speech和Tetra-Diff-Speech。Diff-LM-Speech使用mel-spectrogram和提示编码结构提高语义表示能力,Tetra-Diff-Speech通过持续时间扩散模型实现多样化的韵律表达。实验结果显示这些方法优于基准方法。

一种音调感知的循环连接模型:基于 TRACX2 的探索

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-21T00:00:00Z

谷歌将在Chrome Canary版中添加新图标,将地址栏的HTTPS锁标志换成音调图标,以显示更多信息。这些新图标将在2023年9月发布的Chrome 117版中推出。

解决历史遗留:谷歌发布博客解释为何要将Chrome HTTPS锁换成音调图标

蓝点网
蓝点网 · 2023-05-03T06:02:17Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码