BriefGPT - AI 论文速递 ·

HOIDiffusion: 生成真实的三维手物体交互数据

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

本文提出了一种新方法用于预测三维人物与物体的交互（HOIs），通过交互扩散和校正步骤，利用扩散模型生成逼真的三维交互。研究开发了双分支扩散模型和互动预测扩散模型，以提高动作一致性和接触区域预测的准确性，并提出了新的数据集和手感知条件扩散方法，显著提升了手物互动图像生成的质量和稳定性。

🎯

❓

HOIDiffusion方法通过交互扩散和校正步骤生成逼真的三维人物与物体交互，采用双分支扩散模型和互动预测扩散模型，提高了动作一致性和接触区域预测的准确性。

HandDiffuse12.5M数据集用于可控的互动手势生成，包含强烈的双手互动时间序列，实验证明其在运动生成方面优于现有技术。

HACD通过手-物体交互的语义和几何角度进行建模，并限制去噪点云的质心偏移，从而增强局部特征投影的稳定性和精度。

GeneOH Diffusion方法旨在解决去噪手-物交互中的噪声问题，通过创新的接触中心表示法和领域通用去噪方案改善交互序列的表达。

HanDiffuser架构通过注入手部嵌入信息生成高质量手部图像，结合文本生成手部参数，并以此为条件合成图像。

DiffHOI检测方案通过预先训练的文本-图像扩散模型增强检测器性能，减少交互预测的歧义，并有效缓解现有数据集中的长尾问题。

🏷️