基于面部视频的远程光电容数据测量的双路径 TokenLearner
原文中文,约200字,阅读约需1分钟。发表于: 。使用基于学习 Token 的双路径 TokenLearner(Dual-TL)的原生 Transformer 框架,综合利用面部视频的空间和时间信息,实现高准确度的远程光电体积脉搏测量。
本文介绍了一种名为PhysFormer的基于transformer的架构,用于增强远程光电容积描记术(rPPG)的表示。通过标签分布学习和课程学习提供精细的监督,并在四个基准数据集上进行了实验,证明了其优越性能。