VidFormer:一种融合3DCNN和Transformer的视频基础远程生理测量的全新端到端框架

📝

内容提要

本研究针对通过面部视频进行的远程生理信号测量(rPPG)中所面临的性能平衡问题,提出了一种新颖的端到端框架VidFormer。该框架整合了3DCNN和Transformer模型,并通过引入时空注意机制和信息交换模块,实现了对输入数据的局部和全局特征的高效提取。实验结果表明,VidFormer在五个公开数据集上的表现优于当前最先进的方法,具有重要的应用潜力。

🏷️

标签

➡️

继续阅读