洗牌视觉变换器:轻量级、快速和高效的驾驶员面部表情识别
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了现有驾驶员面部表情识别方法计算密集、无法满足实时应用的问题。提倡的ShuffViT-DFER模型通过结合卷积神经网络和视觉变换器两种轻量高效模型,提出了新的转移学习双架构,从而在精确识别驾驶员面部表情时兼顾了计算效率和准确性。实验结果表明,该方法在两个公共数据集上的表现优于现有的先进技术,具备实时应用的可行性。
本文介绍了一种基于Transformer编码器的方法,用于将视频中的头部运动和面部表情转移到源图像的外观。该方法实现了跨再现,适用于不同的人,具有良好的泛化能力。在运动传输质量和时间一致性方面表现出卓越性能。