超越沉默:音频反欺骗中损失和非对称方法的偏见分析
原文中文,约300字,阅读约需1分钟。发表于: 。当前音频反欺骗检测研究的趋势是改善模型在未见攻击下的泛化能力,学习识别各种欺骗痕迹。最近几项研究指出沉默分布在两个类别之间有所不同,可以作为一种快捷方式。本文将类别解释从沉默延伸,并采用了损失分析和非对称方法,摆脱传统的以攻击为重点和以结果为导向的评价,深入研究了模型行为。我们的调查凸显了两个类别之间训练动态的显著差异,强调未来研究需要关注对正宗类别的健壮建模。
最近的研究发现,训练在部分伪造音频上的对策可以有效地检测篡改。研究者利用Grad-CAM和定量分析度量来解释对策的决策过程。他们发现对策优先考虑伪迹的过渡区域,而不是真实和伪造部分之间的模式差异。这项研究为对策模型的设计和数据集的创建提供了基础,并为局部篡改音频检测领域的解释性奠定了基础。