BriefGPT - AI 论文速递 ·

Dual3D: 双模多视角潜在扩散下高效一致的文本到 3D 生成

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本文提出了一种名为Instant3D的高效文本到3D生成方法，利用预训练的文本到图像扩散模型，在消费级显卡上仅需约8毫秒生成高质量、多样化的3D资产，显著提高了生成速度和视觉质量，无需3D训练数据。

🎯

❓

Instant3D是一种高效的文本到3D生成方法，能够在消费级显卡上仅需约8毫秒生成高质量、多样化的3D资产，无需3D训练数据。

Instant3D通过两阶段的方法，首先生成稀疏一致的四个结构化视图，然后利用基于Transformer的稀疏视图重构器生成3D图像。

Instant3D的生成速度快两个数量级，能够在20秒内生成3D资产，而传统方法通常需要1到10小时。

Instant3D通过整合3D体渲染和跨帧注意力层，设计出自回归生成方法，从而提升了3D图像的一致性和视觉质量。

不需要，Instant3D利用预训练的文本到图像扩散模型生成3D资产，无需3D训练数据。

Instant3D在消费级显卡上仅需约8毫秒生成3D资产，整体生成过程在20秒内完成。

🏷️