本文探讨了多粒度语义交互机制在零样本动作识别中的应用,提出了多层次对齐方法和多语义融合模型,以提高动作识别的准确性。通过结合骨骼特征和文本描述,利用无监督学习和自监督学习方法,增强了模型的鲁棒性和性能,并验证了其在多个数据集上的有效性。
本文提出了一种新方法用于基于骨架的零样本动作识别(STAR),通过对骨架和语义空间的对齐,提升了高相似动作类别的区分能力。实验结果表明,该方法在多个数据集上表现优异,特别是在广义零样本动作识别(GZSSAR)中,利用多语义融合模型显著提高了性能。
完成下面两步后,将自动完成登录并继续当前操作。