基于运动关注机制和帧级自蒸馏的连续手语识别
原文中文,约200字,阅读约需1分钟。发表于: 。基于运动注意机制和帧级别自蒸馏的符号语言连续识别模型,能有效地提取视频中的符号语言运动信息,提高连续符号语言识别的准确性并达到最新水平。
该研究提出了一种基于Transformer模型的新方法,用于连续手语识别和单独手语识别。该方法通过增强和分类手势键点特征来检测连续手语视频中单独手语的边界,并取得了有希望的结果。
基于运动注意机制和帧级别自蒸馏的符号语言连续识别模型,能有效地提取视频中的符号语言运动信息,提高连续符号语言识别的准确性并达到最新水平。
该研究提出了一种基于Transformer模型的新方法,用于连续手语识别和单独手语识别。该方法通过增强和分类手势键点特征来检测连续手语视频中单独手语的边界,并取得了有希望的结果。