HOIDiffusion: 生成真实的三维手物体交互数据

💡 原文中文,约2000字,阅读约需5分钟。
📝

内容提要

本文提出了一种新方法用于预测三维人物与物体的交互(HOIs),通过交互扩散和校正步骤,利用扩散模型生成逼真的三维交互。研究开发了双分支扩散模型和互动预测扩散模型,以提高动作一致性和接触区域预测的准确性,并提出了新的数据集和手感知条件扩散方法,显著提升了手物互动图像生成的质量和稳定性。

🎯

关键要点

  • 提出了一种新方法用于预测三维人物与物体的交互(HOIs),通过交互扩散和校正步骤生成逼真的三维交互。
  • 开发了双分支扩散模型(HOI-DM)和互动预测扩散模型(APDM),提高动作一致性和接触区域预测的准确性。
  • 引入新的数据集 HandDiffuse12.5M,用于可控的互动手势生成,实验证明其在运动生成方面优于现有技术。
  • 提出手感知条件扩散方法(HACD),通过手 - 物体交互的语义和几何角度进行建模,提高形状重构的稳定性和精度。
  • 通过 GeneOH Diffusion 方法解决去噪手 - 物交互中的噪声问题,改善交互序列的表达。
  • HanDiffuser 架构通过注入手部嵌入信息生成高质量手部图像,综合考虑手部表达的多个方面。
  • 提出新的 HOI 检测方案 DiffHOI,通过预先训练的文本 - 图像扩散模型增强检测器性能,减少交互预测的歧义。
  • 研究了使用人物 - 物体交互信息对文本到图像扩散模型进行条件控制的问题,提出可插拔的交互控制模型。

延伸问答

HOIDiffusion方法的主要创新点是什么?

HOIDiffusion方法通过交互扩散和校正步骤生成逼真的三维人物与物体交互,采用双分支扩散模型和互动预测扩散模型,提高了动作一致性和接触区域预测的准确性。

HandDiffuse12.5M数据集的用途是什么?

HandDiffuse12.5M数据集用于可控的互动手势生成,包含强烈的双手互动时间序列,实验证明其在运动生成方面优于现有技术。

手感知条件扩散方法(HACD)是如何提高形状重构的稳定性和精度的?

HACD通过手-物体交互的语义和几何角度进行建模,并限制去噪点云的质心偏移,从而增强局部特征投影的稳定性和精度。

GeneOH Diffusion方法解决了什么问题?

GeneOH Diffusion方法旨在解决去噪手-物交互中的噪声问题,通过创新的接触中心表示法和领域通用去噪方案改善交互序列的表达。

HanDiffuser架构的工作原理是什么?

HanDiffuser架构通过注入手部嵌入信息生成高质量手部图像,结合文本生成手部参数,并以此为条件合成图像。

DiffHOI检测方案的优势是什么?

DiffHOI检测方案通过预先训练的文本-图像扩散模型增强检测器性能,减少交互预测的歧义,并有效缓解现有数据集中的长尾问题。

➡️

继续阅读