本文探讨了自动语音识别(ASR)模型的鲁棒性和隐私保护问题。研究表明,不同攻击算法对模型架构的影响显著,自我监督预训练可提升鲁棒性。提出的“内容隐藏”方法通过掩蔽技术保护语音内容,并评估其对ASR和自动说话者验证(ASV)的影响。实验结果显示,预训练和掩蔽策略能有效提高语音识别性能。
本文研究了语音隐私保护方法中的内容隐藏问题,通过改变预训练的向量量化变分自编码器生成的离散电话表示序列并重新合成,评估了基准掩码技术的三种不同位置和策略。重点研究了掩码对自动语音识别和自动说话者验证的影响,并讨论了如何影响隐私目标的问题。
完成下面两步后,将自动完成登录并继续当前操作。