数据集汇总|DeepFake 乱象丛生,用魔法打败魔法!高质量数据集助力伪造监测技术发展

💡 原文中文,约3500字,阅读约需9分钟。
📝

内容提要

人脸识别技术在安防、支付、零售等领域得到广泛应用,但滥用和深度伪造技术引发了隐私保护和社会秩序的担忧。研究人员开发了多个人脸识别和伪造检测数据集,提供有效的研究工具。

🎯

关键要点

  • 人脸识别技术在安防、支付、零售等领域广泛应用,提升生活便利性和安全性。
  • 人脸识别技术的滥用引发隐私保护问题,企业非法收集人脸信息侵犯消费者隐私权。
  • 深度伪造技术(DeepFake)扰乱社会秩序,犯罪分子利用该技术进行非法牟利。
  • 亟需升级人脸识别和伪造检测技术,以准确判断被篡改的DeepFake视频和图像。
  • 本文梳理了多个人脸识别和DeepFake数据集,帮助研究人员开展相关研究。
  • Deepfake Detection 数据集专为深度伪造检测任务设计,包含全面的视频序列。
  • LAV-DF 数据集包含多模态音频视觉数据,支持视频和音频篡改检测。
  • OpenForensics 数据集支持多人脸伪造检测和分割任务,具有广泛的研究潜力。
  • ForgeryNet 数据集包含290万张图像和221,247个视频,支持多种伪造分析任务。
  • FFIW10K 数据集包含1万个高质量伪造视频,接近现实复杂场景。
  • Glint360K 数据集是最大的人脸识别数据集,包含约1,700万张人脸图像。
  • FaceForensics 数据集用于检测和识别虚假的人脸图像和视频。
  • UTKFace 数据集包含2万多张面部图像,适用于多种人脸识别任务。
  • CelebA 数据集包含超过200K名人的图像,具有丰富的属性注释。
  • VGG-Face2 数据集包含9,131个人的面部数据,涵盖多样性特征。
  • HyperAI超神经致力于成为国内数据科学领域的基础设施,提供丰富的公共资源。
➡️

继续阅读