零样本基于骨架的动作识别的信息补偿框架

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种用于提高广义零样本基于骨骼的动作识别性能的多语义融合模型。该模型采集了两种类级文本描述作为辅助语义信息,通过预训练的编码器提取动作类别和骨骼特征,并利用生成模块学习骨骼和语义特征之间的对齐关系。最后,通过分类模块识别输入样本的动作类别,并采用分类门来预测样本是否来自已知动作类别。与先前模型相比,该模型在广义零样本基于骨骼的动作识别上表现出卓越的性能。

🎯

关键要点

  • 提出了一种多语义融合模型以提高广义零样本基于骨骼的动作识别性能。

  • 模型采集了两种类级文本描述作为辅助语义信息,增强骨骼特征学习能力。

  • 通过预训练的语言编码器和骨骼编码器提取动作类别和骨骼特征。

  • 利用基于变分自动编码器的生成模块学习骨骼和语义特征之间的对齐关系。

  • 构建分类模块识别输入样本的动作类别,并预测样本是否来自已知动作类别。

  • 与先前模型相比,MSF模型在广义零样本基于骨骼的动作识别上表现出卓越的性能。

➡️

继续阅读