本研究提出了首个卫星辅助的三维占用预测模型SA-Occ,结合GPS和IMU数据,提升了动态环境感知能力。实验结果显示,SA-Occ在标准数据集上的mIoU提高了6.97%。
本研究提出了COMODO,一个跨模态自监督蒸馏框架,旨在解决自我中心视频模型在设备识别中的高功耗和隐私问题。COMODO通过无标注数据有效传递视频中的语义知识到IMU,显著提升人类活动分类性能,并展现良好的跨数据集泛化能力。
昨天收到了最后三片IMU,毕业设计的全身动捕系统基本完成。虽然第一颗样品有问题,但四颗Tracker表现良好。测试时发现缺少腰部传感器影响追踪效果。同时分享了朋友的生日照片和玩模型的趣事。
本研究针对从移动设备收集的非独立同分布IMU数据限制了用户感知应用的有效性的问题,提出了一种新颖的方案Prism,旨在实现灵活的用户感知。通过发现IMU数据集中嵌入的任务感知域,并对每个识别的域训练领域感知模型,Prism能够在移动设备上实现高精准度的感知预测,实验结果表明其具备最佳性能并且延迟低。
研究提出了一种新型神经网络架构Kolmogorov-Arnold Networks(KANs),用于传感器人体活动识别的特征提取。KANs通过B样条实现非线性计算,学习样条参数而非权重。在四个公共数据集上的测试显示,KAN特征提取器优于传统CNN,且参数更高效。
本研究针对轮椅用户在姿态跟踪方面的不足之处进行探讨,并提出了一种名为WheelPoser的实时姿态估计系统。该系统仅使用四个战略性放置的IMU传感器,显著提高了轮椅用户的姿态跟踪能力,获得的关节角度平均误差为14.30度,关节位置平均误差为6.74厘米,超过了使用稀疏IMU的类似系统的三倍性能。
本研究提出了HiSC4D,一种新颖的以人为本的互动与4D场景捕捉方法,旨在高效准确地创建动态数字世界,处理大规模室内外场景及丰富的人类互动。研究采用联合优化方法,结合体载IMU和头戴式LiDAR,成功减轻了长时间使用中的漂移问题,并提供了一个包含多个场景的高质量数据集,以促进在大场景中的人类互动研究。
本研究解决了自我中心人类姿态估计中缺乏相关真实世界数据集的问题,提出了EMHI数据集,结合了头戴显示器和身体佩戴的IMU数据。通过与新基线方法MEPoser结合使用,EMHI在准确性上优于现有单模态方法,能够推动自我中心人类姿态估计的研究,并加速这一技术在VR/AR产品中的应用。
本文比较了基于IMU和基于视频的方法在军事按压和划船运动的人体运动分类中的表现。发现单个摄像头比单个IMU提高10%的分类准确率,至少需要3个IMU才能超越单个摄像头。使用多变量时间序列分类器进行原始数据处理的方法优于传统方法。将摄像头和IMU数据组合起来能超越任一数据模态,为人体运动分类提供新的途径。
本文介绍了一种新颖的多模态、多任务和对比基于框架方法 Multi$^3$Net,用于解决人体动作识别中数据有限的问题。该方法通过使用视频数据和对比学习,旨在增强可穿戴人体动作识别的性能,特别是在识别细微活动方面。实验证明,使用该方法从视频生成的合成 IMU 数据训练的模型在识别细粒度活动方面超越了现有方法。
本研究利用Ackermann转向平台的约束非完整运动模型,实现了可靠的纯事件型视觉测距。通过将常规帧摄像机的单特征非线性扩展到准时间连续事件轨迹,并通过变量程度泰勒展开实现多项式形式,实现对多个事件轨迹的鲁棒平均值。实验结果表明,该算法在准确性和稳健性方面表现良好,并在具有挑战性的照明场景中优于传统方法。
本文介绍了一种使用可穿戴传感器恢复人体完整3D姿势的方法,通过融合IMU和头戴式摄像机的数据,实现相机自定位和人体跟踪,并将3D场景约束集成到优化中,以获得精确的姿势。该方法适用于虚拟现实/增强现实应用程序和训练导航与环境交互的代理。
比较了基于IMU和基于视频的人体运动分类方法,发现单个摄像头比单个IMU提高10%的准确率,至少需要3个IMU才能超越摄像头。多变量时间序列分类器优于传统方法。将摄像头和IMU数据组合能超越任一数据模态,为人体运动分类提供新途径。
该论文提出了一种新型的基于IMU的人体活动识别模型rTsfNet,通过多头3D旋转和时间序列特征提取实现自动选择3D基线以从中提取特征,并利用MLP实现HAR。在多个数据集和基准条件下,rTsfNet取得了最高的准确性。
本文比较了基于IMU和基于视频的方法在军事按压和划船运动的人体运动分类中的表现。结果显示,单个摄像头比单个IMU提高了10%的分类准确率,而至少需要3个IMU才能超越单个摄像头。同时,使用基于多变量时间序列分类器进行原始数据处理的方法优于传统方法。最后,将单个摄像头和单个IMU的数据组合起来能超越任一数据模态,为使用智能手机摄像头和单一传感器进行有效的人体运动分类开辟了新的途径。
该文介绍了一种通过IMU解决HPE中能源有限问题的方法。通过DSE探讨了准确性和硬件资源有效利用之间的平衡问题,并提出了综合指标。该方法可用于设计具有适当传感器位置、数据隐私保护和资源感知能力的健康应用。
本文介绍了一种实时人体运动捕捉方法,将RGB图像与惯性信号相结合。通过双坐标策略利用IMU信号进行探索,并引入隐藏状态反馈机制以应对极端输入情况。定量和定性结果表明,该技术在全局方向和局部姿势估计上优于最先进的视觉、IMU和融合方法。
MonoScene提出了一种3D语义场景完成(SSC)框架,通过单个单眼RGB图像推断出场景的密集几何和语义。该框架引入了3D上下文关系先验,以实现空间-语义一致性,并解决了2D到3D的场景重建问题。实验结果显示,该框架在所有指标和数据集上均优于先前的研究,并能够虚构出超出镜头视野的逼真场景。
完成下面两步后,将自动完成登录并继续当前操作。