本文介绍了一种自我中心图像数据集,包含11,243个日常活动中手与物体的交互标签。研究提出了上下文感知的数据增强技术和手物分割模型,以提升手势分类、视频活动识别及3D重建等任务的性能,并探讨了基于深度学习的手势识别方法在AR和VR环境中的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。