小红花·文摘

$HDMI——人形交互式全身控制：宏观上从人类RGB视频中学习全身交互控制，微观上暂依赖动捕数据，且暂一项技能一套策略$

HDMI——人形交互式全身控制：宏观上从人类RGB视频中学习全身交互控制，微观上暂依赖动捕数据，且暂一项技能一套策略

结构之法算法之道 ·

本研究探讨了人类视觉在行为理解中的作用，提出了一种基于行为接触建模的方法，并设计了行为预测框架。通过分析人类视频数据，研究机器人如何学习与未知对象的交互技能，实现零样本操作。引入新数据集HandDiffuse12.5M和生成方法，提升手部姿势生成的质量和控制能力。此外，提出了Diff-IP2D和视觉-运动策略学习框架，优化手物交互预测和机器人控制。

通过手法控制世界

BriefGPT - AI 论文速递 ·