追求文本到三维生成的一致性从单张图像
原文中文,约300字,阅读约需1分钟。发表于: 。一种称为 Consist3D 的三级框架,用于单视图图像到三维生成,包括语义、几何和饱和度一致性的追踪,通过学习参数化一致性令牌和优化阶段,实现更加一致、真实和照片逼真的三维效果。
该文介绍了一种自监督的单视图三维重建模型,通过2D图像和物体的轮廓预测目标物体的3D网格形状、纹理和相机姿势。该方法不需要三维监督、手动注释的关键点、物体的多视图图像或先前的3D模板。通过自监督地学习分类特定图像的部分分割,可以在重建网格与原始图像之间实现语义一致性,减少模型在预测物体形状、纹理和相机姿态时的歧义。该模型可以轻松地推广到各种物体类别,不需要标签。