本文提出了一种新的分层视觉-运动融合框架,利用RGB和LiDAR技术改善场景流,涉及多模态方法、3D人体姿势估计、动态场景捕捉及人类活动识别,展示了在不同数据集上的优越性能,推动了计算机视觉领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。