小红花·文摘

本文探讨了深度学习在语音到文本翻译中的应用，重点研究了端到端架构和CTC损失函数的影响。预训练模型显著提升了翻译性能，实验结果表明其在多个数据集上超越了现有系统。此外，提出了基于CTC的动态音频信号压缩方法和流式多语言模型，优化了翻译质量和效率。

CTC-GMM：用于快速准确流式语音翻译的CTC引导模态匹配

BriefGPT - AI 论文速递 ·

本文介绍了一种基于决策树和GMM的无监督词级韵律标记方法，提升了TTS系统的自然度和可控性。研究比较了多语言神经TTS系统的表示方法，发现单一表示效果更佳。同时，探讨了不同预训练语言模型对TTS任务的影响，提出了DPP-TTS和BASE TTS模型，显著提高了语音的自然度和多样性。这些研究对低资源语言的TTS模型构建具有重要意义。

基于单词的跨语言TTS系统语调模型

BriefGPT - AI 论文速递 ·

该研究解决了关键点提取中评分可解释性不足的问题，提出了一种新的框架来同时精炼和表征关键点的可解释评分。通过应用修改的鲁棒高斯混合模型，该方法显著提高了关键点的重复性和在同质性、高度和多视角姿态恢复任务中的性能。

GMM-IKRS：用于可解释关键点精炼和评分的高斯混合模型

BriefGPT - AI 论文速递 ·

提出了一种基于变分自编码器的模型，该模型以贝叶斯高斯混合模型为基础，在处理表格数据时能够更准确地表示潜在数据分布，同时具有更灵活的特性和更好的性能。

一个改进的表格数据生成器与 VAE-GMM 集成

BriefGPT - AI 论文速递 ·

本期投稿冷静肖楠魏太云谢益辉统计学家在其他领域大放异彩已经不是什么新鲜事，最近公布的三位诺贝尔经济学奖获得者之一，Lars Hansen，就是

COS每周精选:Simply Statistics为你解释GMM

统计之都 ·