小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文探讨了深度学习在语音到文本翻译中的应用,重点研究了端到端架构和CTC损失函数的影响。预训练模型显著提升了翻译性能,实验结果表明其在多个数据集上超越了现有系统。此外,提出了基于CTC的动态音频信号压缩方法和流式多语言模型,优化了翻译质量和效率。

CTC-GMM:用于快速准确流式语音翻译的CTC引导模态匹配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文介绍了一种基于决策树和GMM的无监督词级韵律标记方法,提升了TTS系统的自然度和可控性。研究比较了多语言神经TTS系统的表示方法,发现单一表示效果更佳。同时,探讨了不同预训练语言模型对TTS任务的影响,提出了DPP-TTS和BASE TTS模型,显著提高了语音的自然度和多样性。这些研究对低资源语言的TTS模型构建具有重要意义。

基于单词的跨语言TTS系统语调模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-30T00:00:00Z

该研究解决了关键点提取中评分可解释性不足的问题,提出了一种新的框架来同时精炼和表征关键点的可解释评分。通过应用修改的鲁棒高斯混合模型,该方法显著提高了关键点的重复性和在同质性、高度和多视角姿态恢复任务中的性能。

GMM-IKRS:用于可解释关键点精炼和评分的高斯混合模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-30T00:00:00Z

提出了一种基于变分自编码器的模型,该模型以贝叶斯高斯混合模型为基础,在处理表格数据时能够更准确地表示潜在数据分布,同时具有更灵活的特性和更好的性能。

一个改进的表格数据生成器与 VAE-GMM 集成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-12T00:00:00Z

本期投稿 冷静 肖楠 魏太云 谢益辉 统计学家在其他领域大放异彩已经不是什么新鲜事,最近公布的三位诺贝尔经济学奖获得者之一,Lars Hansen,就是

COS每周精选:Simply Statistics为你解释GMM

统计之都
统计之都 · 2013-10-29T00:40:36Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码