本文探讨了如何利用大型语言模型(LLMs)融合多模态传感器数据以实现活动识别。研究表明,LLMs能够有效融合音频和运动时间序列数据,达到高于随机水平的分类效果。通过零-shot分类,LLMs在缺乏对齐训练数据的情况下支持多模态应用,同时减少模型部署时的内存和计算需求。
本研究提出了一种新的统一框架,结合运动信号活动识别技术与大型语言模型,以提高体育课堂中学生行为分析的准确性。通过自动化生成教学报告,优化学习和教学设计,提升教育质量。
本研究提出了一种新架构,结合用户位置数据与活动识别,解决了聊天机器人实时上下文感知不足的问题,显著提升了用户体验,并展示了在智能家居中的应用前景。
该研究提出了一种在线演化马尔可夫链(EMCs)方法,解决了传统马尔可夫链在动态场景中无法适应行为切换的问题。EMCs能够自适应跟踪转移概率,自动发现模式并检测模式切换,适用于活动识别、电机状态监测及脑电图数据分析,有助于实时建模复杂系统的行为变化。
该研究介绍了多个数据集和方法,以提高多对象跟踪和活动识别的准确性。使用基于C3D神经网络的双流框架、MEVA数据集和Argus++活动检测系统等,在不同场景中取得了优异表现。此外,CycleCrash数据集关注骑自行车者安全,提出的VidNeXt方法有效捕捉视频动态,提升了碰撞预测能力。
本研究提出了ARIC数据集,专注于教室监控图像中的活动识别,涵盖32种活动类别,支持多视角和持续学习,具有重要的教育分析与研究应用潜力。
本文探讨计算机视觉中的偏见问题,特别是在活动识别和图像描述任务中。研究表明,模型在处理偏见实例时存在显著差异,并提出了新的类别条件采样方法以提高识别准确度。通过量化预训练和微调对偏见放大的影响,发现持续预训练性别中性数据可减少群体差异并提升公平性。此外,研究提出了TaMatch框架,解决半监督学习中的确认偏差问题,确保训练公平性。
本文提出了一种新型数字化接触追踪系统,结合蓝牙低功耗信号和多种传感器,利用深度学习和统计方法提高接近度估计的准确性。研究表明,该系统在室内定位和活动识别方面表现优越,定位精度提高超过8%。
本文综述了基于注意力机制和变压器模型的社交群组活动识别技术,提出了多种新方法,显著提升了公开数据集上的识别效果。研究涵盖了传统方法与最新技术的进展,强调了全局交互性和活动识别的挑战,并探索了未来的研究方向。
本文提出了一种迁移学习方法,能够有效识别建筑工人的活动,减少数据需求和计算时间,同时保持较高的分类准确性。该方法在建筑领域具有重要应用价值,尤其对协作机器人有帮助。
该研究评估了多种高性能方法,发现当前实验评估方法无法在可穿戴传感器数据背景下执行活动识别,识别准确度显着下降。该研究解决了在可穿戴传感器数据基础上的人体活动识别中影响识别准确性的关键问题,是第一篇解决这个问题的研究。
完成下面两步后,将自动完成登录并继续当前操作。