HARGPT:是零样本人类活动识别器吗?
原文中文,约400字,阅读约需1分钟。发表于: 。我们的研究通过案例研究,在零样本方式下,通过演示大型语言模型(LLMs)能够理解原始 IMU 数据并以经过适当提示的方式进行人类活动识别任务,以回答 LLMs 是否适用于与网络系统无缝集成的物理世界解释问题。通过在 GPT4 上使用两个不同类别相似性的公共数据集对 HARGPT 进行基准测试,并与基于传统机器学习和最先进的深度分类模型的各种基线进行比较,结果表明 LLMs 能够成功地从原始...
研究发现,当LLM(GPT-4)只有对象检测和分割视觉模型的访问权限时,它可以直接预测操作技能的密集序列的末端执行器姿态。LLMs具备理解低级机器人控制的能力,并能检测到失败并重新规划轨迹。