BriefGPT - AI 论文速递 ·

基于重力视角坐标的世界基础人类运动恢复

💡 原文中文，约1800字，阅读约需5分钟。

📝

内容提要

本文介绍了一种通过分析运动轨迹和重力引力，从单目图像中测量人体高度的方法，平均绝对误差为3.9厘米。同时，提出了GraviCap和WHAM等新方法，利用重力和运动捕捉数据提高3D人体动作捕捉的准确性，结合人体运动先验知识和场景特征，显著改善了人体和相机运动的估计。

🎯

关键要点

本文提出了一种通过分析运动轨迹和重力引力，从单目图像中测量人体高度的方法，平均绝对误差为3.9厘米。
GraviCap是一种新的联合无标记3D人体动作捕捉和单目RGB视频对象轨迹估计的方法，利用重力约束物体运动，提升3D重建的几何一致性。
研究利用物理引擎改进姿态估计，能够处理自身接触和与场景几何之间的接触，获得与现有方法相竞争的结果。
提出了一种从野外视频中重建全球人类轨迹的方法，优化相机和人类运动解耦，减少背景像素对3D人类运动推断的影响。
结合人体运动先验知识和场景特征，提出了一种联合优化框架，显著改善了人体和相机运动的估计。
WHAM方法通过运动捕捉数据将2D关键点序列提升到3D，能够准确高效地重建3D人体动作，并在多个基准测试中表现优异。
WHAC框架通过整合世界、人体和摄像头之间的协同作用，促进人体姿势和形状估计，提供了新的合成数据集WHAC-A-Mole。
TRAM方法通过增强SLAM和场景背景推导运动尺度，实现了对3D人体的准确恢复，减少了全局运动误差60%。
OfCaM提供了一种新的相机运动尺度校准方法，降低全局人体运动误差60%，且推理时间成本更低。

❓

延伸问答

如何通过单目图像测量人体高度？

通过分析运动轨迹和重力引力的方法，可以从单目图像中测量人体高度，平均绝对误差为3.9厘米。

GraviCap方法的主要特点是什么？

GraviCap是一种联合无标记3D人体动作捕捉和单目RGB视频对象轨迹估计的方法，利用重力约束物体运动，提升3D重建的几何一致性。

WHAM方法如何提升3D人体动作重建的准确性？

WHAM通过运动捕捉数据将2D关键点序列提升到3D，并结合视频特征，能够准确高效地重建3D人体动作。

TRAM方法的优势是什么？

TRAM方法通过增强SLAM和场景背景推导运动尺度，实现了对3D人体的准确恢复，减少了全局运动误差60%。

WHAC框架的创新之处在哪里？

WHAC框架通过整合世界、人体和摄像头之间的协同作用，促进人体姿势和形状估计，提供了新的合成数据集WHAC-A-Mole。

OfCaM方法如何改善相机运动尺度校准？

OfCaM提供了一种新的相机运动尺度校准方法，降低全局人体运动误差60%，且推理时间成本更低。

🏷️

标签

3D动作捕捉 GraviCap 人体高度测量运动轨迹重力引力

➡️

继续阅读

实测 Doubao-Seed-Evolving：把 Windows 桌面图标做成一个会自己运转的小世界 - 努力的小雨
豆包 Seed 又更新了：一张永远“最新”的模型卡这次豆包推出的不是一个过段时间就会落后的固定版本，而是 Doubao-Seed-Evolving：一个...
Twitter之父再出手：Block开源Buzz，要让人类和AI Agent「同工同权」
Block（原Square）7月22日开源发布协作平台Buzz——一个基于Nostr协议、让人类员工与AI Agent在同一工作区内以「同等身份」协同工作...
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
澳鹏数据已连续八届深度参与世界人工智能大会
(全球TMT 2026年07月21日讯)2026年7月17日至20日，2026世界人工智能大会暨人工智能全球治 […]
Presentation: From Copy-Paste to Composition: Building Agents Like Real Software
Jake Mannix discusses moving AI agents past chaotic "1970s BASIC" arc...
I made a policy engine think it was in production
Kyverno is a Kubernetes-native policy engine that validates, mutates, and gen...