最小数据下的卡塔卡利手势识别

原文约400字,阅读约需1分钟。发表于:

印度古典舞蹈剧 Kathakali 有一组手势称为 Mudras,它们构成了所有舞姿和动作的基本单元。本研究将这个问题视作一个 24 类分类任务,并提出了一种基于姿势估计的向量相似性方法,消除了进一步训练或微调的需要。这种方法克服了数据稀缺性的挑战,从而限制了在类似领域中应用人工智能的范围。该方法在艺术形式中达到了 92% 的准确率,与领域中现有的基于模型训练的作品相当或更好,而且该方法即使在只有 1 或 5 个样本的情况下仍可正常工作,性能略有降低。可用于图像、视频甚至实时流。该系统可以处理手部剪裁或全身图像。我们在这项工作中开发并公开了 Kathakali Mudra Recognition 数据集。

该研究提出了一种基于姿势估计的向量相似性方法,用于识别印度古典舞蹈剧Kathakali中的手势。该方法准确率达到92%,可处理手部剪裁或全身图像。

相关推荐 去reddit讨论