Tailor3D:基于双面图像的定制化 3D 资产编辑和生成

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

我们提出了Dual3D,一种新颖的文本到3D生成框架,仅需1分钟生成高质量的3D资产。通过双模态多视图潜在扩散模型和双模态切换推理策略,可以快速生成高质量的3D资产。

🎯

关键要点

  • 提出了Dual3D,一种新颖的文本到3D生成框架。
  • 仅需1分钟从文本生成高质量的3D资产。
  • 关键组件是双模态多视图潜在扩散模型。
  • 通过单个潜在去噪网络有效去噪多视图潜在。
  • 在3D模式下生成一致渲染的三面神经表面实现去噪。
  • 通过预训练的文本到图像潜在扩散模型调整多数模块,避免昂贵的从头训练。
  • 提出双模态切换推理策略,仅使用1/10的去噪步骤和3D模式。
  • 在仅10秒内成功生成高质量的3D资产。
  • 通过高效的纹理细化过程进一步增强3D资产的纹理。
  • 大量实验证明该方法显著减少生成时间并提供最先进的性能。
➡️

继续阅读