MMGDreamer:用于几何可控三维室内场景生成的混合模态图

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了MMGDreamer,一个双分支扩散模型,克服了基于图的三维场景生成对文本输入的限制,显著提高了场景生成的可控性和视觉真实度。

🎯

关键要点

  • 本研究提出了MMGDreamer,一个双分支扩散模型。
  • MMGDreamer克服了基于图的三维场景生成对文本输入的限制。
  • 该模型显著提高了场景生成的可控性和视觉真实度。
  • 研究解决了当前方法对灵活用户输入适应性不足的问题。
  • 使用新颖的混合模态图来提高场景生成的几何可控性。
  • 模型通过融合文本和视觉模态的对象节点及其关系预测功能,提升了生成性能。
➡️

继续阅读