OmniSpeech 将实时深度伪造音频检测功能集成到 Zoom,用户可以实时识别 AI 生成或篡改的音频,适用于远程面试和财务授权等场景,确保语音的真实性。
本研究建立了多类型深度伪造音频检测基准,采用波形提示调优的自监督学习方法,优化检测效果,平均错误率为3.58%。
本研究提出了一种名为区域优化(RegO)的持续学习方法,旨在提升音频深度伪造检测的效果。该方法通过区域自适应优化,平衡存储稳定性与学习灵活性,实验结果表明其错误接受率提高了21.3%。
完成下面两步后,将自动完成登录并继续当前操作。