本文研究了歌声深度伪造检测,创建了名为SingFake的数据集,包含真实与伪造歌曲。评估了多种区分真实与合成语音的方法,并提出基于自监督学习的歌手身份编码器框架,提升了歌手识别的准确性。同时探讨了声音伪造的社会挑战,强调声音编辑的重要性,并提出新的挑战数据集和检测系统。
本文探讨了歌声深度伪造检测及相关挑战,介绍了第一个真实数据集SingFake,包含多位歌手的真实与伪造歌曲。研究表明,基于自监督学习的歌声转换系统在跨域任务中表现优异,强调了数据集规模对模型性能的重要性,并分析了语音识别在歌唱中的复杂性及未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。