小红花·文摘

本研究探讨了人类视觉在行为理解中的作用，提出了一种基于行为接触建模的方法，并设计了行为预测框架。通过分析人类视频数据，研究机器人如何学习与未知对象的交互技能，实现零样本操作。引入新数据集HandDiffuse12.5M和生成方法，提升手部姿势生成的质量和控制能力。此外，提出了Diff-IP2D和视觉-运动策略学习框架，优化手物交互预测和机器人控制。

通过手法控制世界

BriefGPT - AI 论文速递 ·

该论文提出了一种实时方法，利用单个RGB相机捕捉人手骨骼姿势和三维几何形状，考虑手间交互。通过多任务CNN回归多种信息，实验表明该方法在双手追踪和三维重建方面优于现有RGB方法，并与基于深度的方法相媲美。此外，论文介绍了多个新数据集和手部重建技术，展示了在纹理重建和姿势估计方面的优越性。

BiTT: 从单张图像中双向重建互动的双手纹理

BriefGPT - AI 论文速递 ·

本研究介绍了一种名为GRIP的基于学习的方法，用于模拟真实手部与物体的相互作用。GRIP能够生成精确的手部姿势，避免手与物体的穿透。实验证明，GRIP优于基准方法，并适用于不同动作捕捉数据集中的不可见物体和动作。

GRIP: 使用潜在一致性和空间线索生成交互姿态

BriefGPT - AI 论文速递 ·