本研究提出了一种新的自监督正样本采样技术(SSPS),有效克服了传统说话人验证方法的局限性。SSPS显著提高了验证性能,SimCLR-SSPS的错误率降低了58%,与DINO-SSPS表现相当。
迭代自训练(IPL)通过改进模型生成伪标签,提升说话人表示质量。研究表明,简单的i-vector生成模型足以启动IPL过程,尽管初始模型较弱,但仍能达到与最先进方法相媲美的说话人验证性能。
最近大型语言模型的成功引起了广泛关注。研究者开展了说话人验证模型的开发和评估,发现当前的角色扮演模型未能准确模仿说话者,主要原因是固有的语言特点。
本文介绍了一种分解的分层变分自动编码器,能够无监督地学习序列数据的分离和可解释的表征。该模型在转换说话人或语言内容以及说话人验证和自动语音识别任务中优于基线模型。
完成下面两步后,将自动完成登录并继续当前操作。