该研究介绍了首个真实音频-视觉深度伪造数据库SWAN-DF,展示了高质量的嘴唇与语音同步。研究表明,调整预训练模型可以成功欺骗识别系统,并使用Whisper模型提高声音DeepFake检测的准确性。此外,提出了新的深度伪造检测框架和算法,以增强音频的真实性和媒体身份验证。
完成下面两步后,将自动完成登录并继续当前操作。