无模板重构人物 - 物体交互与程序交互生成

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

GenZI是第一个零样本方法,用于生成3D人与场景的交互。通过从大型视觉-语言模型中提取交互先验知识,利用自然语言描述和场景中的粗略点位置,合成场景中的3D人模型的姿态和形状。与传统方法相比,GenZI不需要捕获3D交互数据,使用简单易用的文字提示进行灵活控制。实验证明该方法适用于各种场景类型。

🎯

关键要点

  • GenZI是第一个零样本方法,用于生成3D人与场景的交互。
  • 该方法从大型视觉-语言模型中提取交互先验知识,学习丰富的二维人-场景组合的语义空间。
  • 通过自然语言描述和3D场景中的粗略点位置,合成场景中的3D人模型的姿态和形状。
  • GenZI避免了对捕获的3D交互数据的需求,使用简单易用的文字提示进行灵活控制。
  • 实验证明GenZI具有高灵活性和广泛适用性,适用于各种场景类型,包括室内和室外环境。
➡️

继续阅读