本研究探讨了视觉触觉传感器与IMU数据手套在15种人类活动识别中的表现,提出了结合触觉与运动数据的多模态框架,结果表明多模态方法的准确性优于单一模态,显示了其在合作机器人中的应用潜力。
本研究提出RadMamba模型,旨在提高基于雷达的人类活动识别(HAR)的效率。该模型在多个数据集上表现出与顶尖模型相当的准确性,同时显著减少了参数数量,显示出在轻量级HAR应用中的潜力。
我们提出了一种新颖的自监督相对对比学习方法RelCon,用于从可穿戴加速度传感器训练运动基础模型。该模型通过学习距离度量捕捉相似性和领域特定语义信息,经过训练后在87376名参与者的10亿段数据上表现优异,适用于人类活动识别和步态度量回归等多种下游任务。
本研究提出了一种基于RGB事件传感器的人类活动识别方法,解决了传统RGB相机在低光照和快速移动情况下的性能问题。新开发的HARDVS 2.0基准数据集包含300类真实世界动作,结合RGB和事件相机,采用多模态热传导模型,展现出优越的有效性和鲁棒性。
本研究提出了一种多头自适应图卷积网络,用于低光照环境下的稀疏点云人类活动识别。该方法通过动态调整卷积核,提高了识别的准确性和效率,实验结果在基准数据集上表现优异,具有实用价值。
本研究提出了一种基于物理知识的多任务预训练框架(PIM),旨在提高基于惯性传感器的人类活动识别准确性。通过自监督学习利用人体运动的物理特征,实验结果表明该方法在多个数据集上优于现有技术,尤其在少量标签样本中表现出显著的性能提升潜力。
本研究提出了一种针对智能家居环境的可解释图神经网络(GNN),解决了人类活动识别的可解释性问题,提高了识别率,并展示了在医疗保健领域的应用潜力。
本研究评估了人类活动识别中的模型性能,比较了经典机器学习、深度学习和限制玻尔兹曼机,结果显示卷积神经网络在复杂数据集上表现最佳,为模型选择提供了指导。
本研究分析了机器学习在人类活动识别中的应用,指出当前研究忽视负样本细节。通过对六个基准数据集的深入检查,发现现有方法在分类某些数据片段时存在问题,揭示了注释模糊和记录不规则等核心问题,并为未来的数据收集提供了改进建议。
本研究探讨了生成对抗网络(GANs)在合成手势数据生成中的应用,以解决人类活动识别(HAR)领域的数据稀缺问题。结果表明,合成数据在医疗健康领域表现良好,能够有效替代真实数据,提升手势识别模型的泛化能力。
本研究提出了一种新方法,通过将上下文中的过程信息与机器学习模型生成的概率事件对齐,显著提升了人类活动识别的准确性和宏观F1分数,展现出较大的应用潜力。
本文介绍了基于事件相机的人类活动识别研究,重点包括新数据集HARDVS和DailyDVS-200,以及ESTF框架和EVMamba网络的应用,展示了在动作识别和目标检测中的高效性能和低能耗优势。
本文探讨了深度学习在普适计算中的人类活动识别技术,介绍了循环神经网络的训练方法及模型适用性。研究利用多模态数据和自我监督学习技术提升活动识别模型性能,并提出新方法解决数据稀缺问题,分析了编码器和解码器架构的扩展性,为模型设计提供新方向。
本文探讨了深度学习在普适计算中的人类活动识别(HAR)技术,提出了多种模型和方法,包括使用图像传感器替代加速度传感器、轻量模型HART及自监督学习。研究表明,新型神经网络架构和数据注释技术能有效提高活动识别的准确性和效率。
本文探讨了人类活动识别中的全局方法和基于姿势的方法,强调两者的互补性以实现最佳性能。提出的深度学习模型如HAMLET和CMC-CMKM显著提升了活动识别的准确性和鲁棒性,同时自监督学习和多模态数据集在该领域也具有重要意义。
本文介绍了多种基于深度学习的模型,如Gibbs-Duhem-informed神经网络、超图神经网络DisenHCN和SMILES-to-Properties-Transformer,这些模型在预测化学性质和人类活动识别方面的准确性和性能均优于传统方法,展示了深度学习在科学研究中的应用潜力。
本研究探讨了大型语言模型(LLMs)在零样本条件下理解原始IMU数据并进行人类活动识别的能力。基准测试结果显示,LLMs在识别任务中优于传统模型,展现了其分析传感器数据的潜力。此外,研究还探讨了LLMs在健康预测和生成虚拟数据方面的应用,显示了其在医疗领域的有效性和前景。
本文探讨了通过跨模态学习和深度神经网络提高人类活动识别(HAR)性能的方法。研究利用运动合成模型生成3D运动序列,并结合IMU数据进行训练,显著提升识别准确性。提出的IMUGPT扩展和多样性指标有效解决数据稀缺问题,优化虚拟IMU数据生成。实验表明,结合视频和IMU数据能更好地分类人体运动,展示了多模态学习的应用潜力。
本文介绍了多种人类活动识别(HAR)技术,包括通用多传感器网络(UMSNet)、多模态自监督学习框架(CMC-CMKM)和基于知识蒸馏的多模态知识增强框架(MKE)。这些方法通过自监督学习和多模态数据结合,显著提升了活动识别的准确性和效率。
本文提出了一种新的分层视觉-运动融合框架,利用RGB和LiDAR技术改善场景流,涉及多模态方法、3D人体姿势估计、动态场景捕捉及人类活动识别,展示了在不同数据集上的优越性能,推动了计算机视觉领域的发展。
完成下面两步后,将自动完成登录并继续当前操作。