GROOT:基于扩散模型的音频合成生成鲁棒性水印
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
合成语音的逼真性不断增强,但伦理问题也随之出现。音频水印技术可以解决虚假信息传播的问题,但在面对干扰时仍不稳健。本文提出了一个评估音频水印技术稳健性的系统化基准,结果显示当前技术脆弱,需要更稳健和公平的音频水印技术。
🎯
关键要点
- 合成语音的逼真性增强引发伦理问题,如伪装和虚假信息传播。
- 音频水印技术通过嵌入无感知水印提供解决方案,但其稳健性尚未充分研究。
- 本文提出 AudioMarkBench,评估音频水印技术对水印消除和篡改的稳健性。
- AudioMarkBench 包括新数据集、三种水印技术和十五种干扰类型。
- 研究结果显示当前水印技术脆弱,需更稳健和公平的音频水印技术。
- 数据集和代码可在 https://github.com/moyangkuo/AudioMarkBench 获取。
➡️