减轻未经授权的语音合成以保护声音
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了近年来由于语音样本的轻易复制而导致的语音滥用问题,尤其是电信诈骗的风险。提出了一种新颖的主动保护技术Pivotal Objective Perturbation (POP),通过对原始语音样本施加不可察觉的噪声,从而有效防止高质量的深度伪造语音生成。实验结果表明,POP显著提高了语音的不清晰度,并且在多种模型中表现出优异的有效性和可转移性。
最近,Whisper等大型语音模型在自动语音识别中广泛应用,但研究表明其易受对抗攻击。我们提出了一种通过添加特殊令牌使模型“静音”的方法,实验显示该方法在97%的样本中有效。这表明Whisper模型在现实环境中存在脆弱性,可能影响私人数据的安全。