SONAR:合成 AI 音频检测框架及基准
原文中文,约400字,阅读约需1分钟。发表于: 。本研究针对当前 AI 合成音频检测技术的不足,提出了 SONAR 框架及基准,旨在综合评估各类 AI 合成音频内容。通过大规模实验,我们发现基础模型在检测中的泛化能力较强,同时探讨了少量样本微调的有效性,为针对特定实体的检测系统提供了可能的优化方向。
合成语音的逼真性提升引发伦理问题,如伪装和虚假信息传播。音频水印技术通过嵌入无感知水印提供解决方案,但稳健性不足。AudioMarkBench基准用于评估水印技术稳健性,包含新数据集、三种水印技术和十五种干扰类型。研究显示当前技术脆弱,需更稳健的水印技术。数据集和代码已公开。