小红花·文摘

本文介绍了一种自我中心图像数据集，包含11,243个日常活动中手与物体的交互标签。研究提出了上下文感知的数据增强技术和手物分割模型，以提升手势分类、视频活动识别及3D重建等任务的性能，并探讨了基于深度学习的手势识别方法在AR和VR环境中的应用潜力。