MMGDreamer:用于几何可控三维室内场景生成的混合模态图
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了MMGDreamer,一个双分支扩散模型,克服了基于图的三维场景生成对文本输入的限制,显著提高了场景生成的可控性和视觉真实度。
🎯
关键要点
- 本研究提出了MMGDreamer,一个双分支扩散模型。
- MMGDreamer克服了基于图的三维场景生成对文本输入的限制。
- 该模型显著提高了场景生成的可控性和视觉真实度。
- 研究解决了当前方法对灵活用户输入适应性不足的问题。
- 使用新颖的混合模态图来提高场景生成的几何可控性。
- 模型通过融合文本和视觉模态的对象节点及其关系预测功能,提升了生成性能。
🏷️
标签
➡️