CapST:一种强化且轻量化的深度伪造视频分类方法
原文中文,约300字,阅读约需1分钟。发表于: 。通过创新和简化的模型,本研究致力于对通过五种不同的编码器生成的深度伪造视频进行分类,该模型在性能上达到最新水平,并且优化了计算资源的利用。该模型结合了 VGG19bn 的一部分作为骨干,使用胶囊网络和时空注意机制增强了模型的分类能力,并通过聚合帧之间的洞察力获得了视频内容的整体理解。实验结果证明了我们的方法在准确分类深度伪造视频方面相较于基线模型提升了 4 个百分点,并且对计算资源的需求更低。
该研究通过简化模型对五种不同编码器生成的深度伪造视频进行分类,性能达到最新水平,计算资源利用更优化。实验结果表明,该方法相较于基线模型提升了4个百分点,计算资源需求更低。