本研究提出了一种新方法,通过文本生成高质量的三维人物-物体交互场景。该方法利用双分支扩散模型和互动预测扩散模型,增强了人和物体之间的动作一致性。实验结果表明,该方法在生成逼真互动方面优于现有技术,能够有效处理复杂的空间关系和多样的物体形状。
本文提出了一种新方法用于预测三维人物与物体的交互(HOIs),通过交互扩散和校正步骤,利用扩散模型生成逼真的三维交互。研究开发了双分支扩散模型和互动预测扩散模型,以提高动作一致性和接触区域预测的准确性,并提出了新的数据集和手感知条件扩散方法,显著提升了手物互动图像生成的质量和稳定性。
完成下面两步后,将自动完成登录并继续当前操作。