多尺度视频变换网络用于手势识别
发表于: 。本研究针对动态手势识别中的多尺度特征提取挑战,提出了一种新颖的多尺度视频变换网络(MVTN)。该模型通过多尺度特征层次结构有效捕捉手势的多样性和细节,结合多模态数据,展现出卓越的识别性能,同时计算复杂度和参数量也得到了优化。
本研究针对动态手势识别中的多尺度特征提取挑战,提出了一种新颖的多尺度视频变换网络(MVTN)。该模型通过多尺度特征层次结构有效捕捉手势的多样性和细节,结合多模态数据,展现出卓越的识别性能,同时计算复杂度和参数量也得到了优化。