小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
语音质量维度作为非典型语音和情感表达的可解释原始元素

本文探讨了语音质量模型在非典型语音和语音调制中的应用,评估了可懂度、自然度等七个维度。研究利用公共语音可及性项目的数据集,验证了模型在不同语言和任务上的性能,特别对面临失语风险的人群(如ALS患者)具有重要意义。

语音质量维度作为非典型语音和情感表达的可解释原始元素

Apple Machine Learning Research
Apple Machine Learning Research · 2025-06-05T00:00:00Z

本研究强调云端语音助手中语音匿名化的重要性,提出了一种基于人类听觉系统的感知驱动损失函数。使用该函数的VQVAE模型在自然性、可懂度和韵律上优于传统模型,同时保持说话者匿名性,并在多种数据集、语言和性别中表现良好。

Enhancing Audio Quality in Speech Anonymization with Perception-Driven Loss

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-20T00:00:00Z

本文提出了一种基于LSTM网络的端到端视觉语音识别系统,取得了最先进的分类性能。在OuluVS2数据库上比基准提高了9.7%,在CUAVE数据库上比其他类似方法的系统提高了1.5%。

基于注意力长短期记忆 (LSTM) 的语音可懂度自动分类系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-05T00:00:00Z

本研究使用神经网络和自监督、弱监督模型的中间层特征表示,结合人类记忆的心理模型,预测助听器用户的可懂度评级,并在不同任务和训练数据中取得了显着性能提升。

基于中间 ASR 特征和人类记忆模型的面向听障用户的非侵入式语音可懂度预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-24T00:00:00Z

本文研究了对RNN的训练的多个方面,关注增强语音频谱的RNN,提出了两种学习目标,并通过客观质量和可懂度指标进行评估。研究了特征归一化和批次序列长度对增强语音质量的影响,并展示了所提出方法和最先进的实时RNN方法的主观评分。

CheapNET: 通过投影损失函数改进轻量级语音增强网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-27T00:00:00Z

本研究使用Whisper自动语音识别模型,以语音为基础的上下文学习方法,显著减少两种方言中的词错误率,平均降低率为32.3%。基于k最近邻的示例选择技术能将平均相对WER减少率提高至36.4%。研究还对发音变化和方言特定的词汇细微差别的适应性进行了详细的定量分析。

利用 Whisper 增强 Hearing Aids 的多分支语音可懂度预测模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-18T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码