DreamStory: 基于 LLM 引导的多主题一致扩散的开放域故事可视化

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

MVDream是一个多视图扩散模型,生成几何一致的多视图图像。利用预训练的图像扩散模型和3D资源渲染的多视图数据集,实现2D扩散的概括性和3D数据的一致性。解决现有方法中的3D一致性问题,并可用于个性化的3D生成。

🎯

关键要点

  • MVDream是一个多视图扩散模型,能够生成几何一致的多视图图像。
  • 该模型利用预训练的图像扩散模型和3D资源渲染的多视图数据集。
  • MVDream实现了2D扩散的概括性和3D数据的一致性。
  • 模型通过Score Distillation Sampling解决现有2D-lifting方法中的3D一致性问题。
  • 多视图扩散模型可以在少量样本下微调,用于个性化的3D生成。
➡️

继续阅读