小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Google AI 发布 WAXAL:用于训练自动语音识别和文本转语音模型的多语言非洲语音数据集

WAXAL是一个开放的多语言语音数据集,涵盖24种非洲语言,专为自动语音识别(ASR)和文本转语音(TTS)设计。ASR部分通过图像提示自然采集语音,TTS部分在录音棚中高质量录制,确保语音一致性。

Google AI 发布 WAXAL:用于训练自动语音识别和文本转语音模型的多语言非洲语音数据集

实时互动网
实时互动网 · 2026-03-19T02:10:27Z
AI 语音数据集如何助力打造自然流畅的语音系统

近年来,AI语音技术迅速发展,依赖于高质量、多样化的语音数据集。这些数据集通过数据收集、预处理和训练,帮助AI生成自然语音,广泛应用于虚拟助手和有声读物等领域。随着技术进步,语音AI的功能和个性化不断提升,确保数据质量和多样性至关重要。

AI 语音数据集如何助力打造自然流畅的语音系统

实时互动网
实时互动网 · 2025-12-12T03:30:13Z

本研究提出了Paralinguistic Speech Captions(ParaSpeechCaps)数据集,解决了大规模语音数据集风格标签不足的问题。通过结合多种文本与语音嵌入技术,自动扩展了59种风格标签的数据集。微调TTS模型后,语音风格一致性和自然度显著提高,展示了研究的潜在影响。

Scaling Rich Style-Prompted Text-to-Speech Datasets

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究评估了现有语音数据集在团队协作问题解决中的适用性,填补了机器学习模型开发中的数据缺口,并提出了未来数据集设计的要求,为提高协作问题解决效果提供了理论基础。

现有语音数据集在团队问题解决中训练机器学习模型适用性的概述与讨论

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-24T00:00:00Z

本文通过多阶段增强方法改进阿拉伯语言障碍患者的自动语音识别性能。使用基于信号的方法生成阿拉伯语言障碍患者的语音,并通过对英语语言障碍患者语音数据进行训练以进行多语言扩充。实验结果显示,相比只针对健康数据训练的基础模型,本文方法在阿拉伯语言障碍患者的语音数据集上实现了18%的词错误率和17.2%的字符错误率的提升,并在真实的英文语言障碍患者语音数据集上实现了124%的词错误率的提升。

在阿拉伯电话领域中评估自动语音识别系统的新基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-07T00:00:00Z

MyVoice是一个收集阿拉伯语言方言的语音数据集的众包平台,允许参与者选择城市/国家级的细粒度方言,并录制显示的话语。该平台整合了质量保证系统,管理员可以添加新数据或任务,并将其显示给贡献者,促进收集多样化和大量的阿拉伯语言数据的协作努力。

VoxArabica: 一个强壮的方言感知阿拉伯语语音识别系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-17T00:00:00Z

ADReSS Challenge是一个用于比较自动识别老年痴呆症语音的共享任务,提供了基准的语音数据集和两个认知评估任务。该挑战旨在为语音和语言老年痴呆症研究社区提供一个综合方法比较的平台,为未来的研究和临床应用提供线索。

用于阿尔茨海默病检测的转移语音通用和抑郁症特定知识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-06T00:00:00Z

本文介绍了一种使用深度卷积神经网络作为结构变分近似的推理网络的无监督模型ConvDMM,它使用非线性发射和转移函数模型的高斯状态空间模型。ConvDMM在大规模语音数据集上进行训练,产生的特征在线性电话分类和在WSJ数据集上的识别方面显着优于多个自我监督的特征提取方法,并且可以与其他自我监督的方法相辅相成,进一步提高了结果。在少量标记训练示例的极低资源之下,ConvDMM功能使得学习更好的电话识别器比任何其他功能。

使用随机变分深层核学习的并行和有限数据语音转换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-08T00:00:00Z

该文章介绍了Expresso数据集,用于无文字语音合成,包括朗读语音和即兴对话。作者通过表达性再合成基准评估了不同自我监督离散编码器的合成质量,并探讨了质量、比特率和对说话人和风格的不变性之间的权衡。所有数据集、评估指标和基线模型均为开源。

EXPRESSO:离散表达性语音重新合成的基准和分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码