FaceXFormer:面部分析的统一 Transformer

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

FaceXformer是一个端到端的统一变换器模型,用于综合范围的面部分析任务。它利用基于变换器的编码器-解码器架构,将多个任务集成到一个框架中,并提出了一个参数高效的解码器FaceX,用于学习通用和鲁棒的面部表示。在多个基准测试中,FaceXformer表现出色,并且对来自“野外”的图像也具有鲁棒性和普适性。

🎯

关键要点

  • FaceXformer是一个端到端的统一变换器模型,用于综合范围的面部分析任务。
  • 该模型包括面部解析、标志检测、头部姿势估计、属性识别等任务。
  • FaceXformer利用基于变换器的编码器-解码器架构,将多个任务集成到一个框架中。
  • 提出了一个参数高效的解码器FaceX,用于学习通用和鲁棒的面部表示。
  • 这是首次使用变换器提出一个能够处理所有面部分析任务的单一模型。
  • 模型在多个基准测试中表现出色,优于最先进的专用模型和之前的多任务模型。
  • FaceXformer有效处理来自“野外”的图像,展示了在八个不同任务上的鲁棒性和普适性。
  • 模型保持每秒37帧的实时性能。
➡️

继续阅读