小红花·文摘 - 小红花技术领袖俱乐部

本文研究了语音信号的音色及其属性检测（vTAD）。结果表明，ECAPA-TDNN编码器在已见场景中表现优异，而FACodec编码器在未见场景中具有更好的泛化能力。

语音音色属性检测的介绍

BriefGPT - AI 论文速递 ·

该研究提出了一种新方法AnCoGen，通过掩码自编码器分析、控制和生成语音信号，实现对说话者身份和音高等属性的精确控制，效果显著。

AnCoGen: Analyzing, Controlling, and Generating Speech through Masked Autoencoders

BriefGPT - AI 论文速递 ·

本研究利用长短期记忆网络（LSTM）和多层感知机（MLP）分析帕金森病患者的语音信号特征，以提高早期诊断和疾病进展预测的准确性。结果表明，所选特征能有效预测疾病在2期和3期的进展。

Detection and Prediction of Parkinson's Disease Progression Based on Speech Signal Features: Application of Multi-Layer Perceptron and Long Short-Term Memory Networks

BriefGPT - AI 论文速递 ·

本文探讨了多模式深度学习在抑郁症和阿尔茨海默病检测中的应用，强调语音和文本特征对提高诊断准确性的作用。研究表明，语音信号是抑郁症筛查的重要标志，深度学习技术在自动检测中表现出良好效果，尤其是结合情感信息和多模态数据时，显著提升了检测性能和稳定性。

基于临床访谈的自动检测抑郁症和阿尔茨海默病的信心估计

BriefGPT - AI 论文速递 ·

该文介绍了一种算法，可以在语音信号中添加几乎不可察觉的扰动，欺骗自动语音识别系统。实验表明该技术可以用于最新的自动语音识别系统，也可以在未参与训练的模型上应用。

音频狡猾：快速、通用和无需同步的跨领域语音识别攻击

BriefGPT - AI 论文速递 ·