VGGT-Edit是一种新型3D编辑框架,旨在直接在3D空间中进行编辑,避免传统2D方法的不稳定性。该模型通过残差场预测和深度同步文本注入,实现快速、稳定的3D场景修改,单次编辑约需5秒,速度提升可达120倍。研究团队构建了DeltaScene数据集,以确保多视角下的几何一致性,推动3D编辑技术的发展。
腾讯混元团队推出的WorldPlay是一个实时交互的世界模型,解决了生成速度与内存占用之间的平衡。该模型通过双重动作表示法、重构上下文记忆机制和情境强迫蒸馏方法,实现了长期几何一致性,能够以24 FPS生成720p高清流媒体视频,展现出优秀的泛化能力。
浙大团队提出了一种新方法——体素对齐的前馈3D高斯泼溅,解决了二维特征在三维空间对齐及高斯密度受限的问题,提升了多视角渲染的质量与效率。该方法通过将2D特征聚合到3D体素网格中,增强了几何一致性和跨视图稳定性,适用于机器人、自动驾驶及AR/VR等领域。
本研究提出了GC MVSNet++模型,解决了传统多视角立体视觉方法在几何一致性检查中的不足。实验结果表明,该方法加快了学习过程,并在多个数据集上取得了最佳性能,展示了监督学习在多视角和多尺度几何一致性中的潜力。
本研究提出了一种自监督方法,能够从无姿势的互联网照片生成3D一致性视频。该方法利用视频一致性和多视角照片的可变性,训练可扩展的3D感知视频模型,无需3D注释。实验结果表明,该方法在几何和外观一致性方面优于现有基线,适用于需要摄像机控制的应用。
本研究提出M3D框架,旨在解决从单个RGB图像重建3D对象的挑战。该框架采用双流特征提取策略,显著提升了场景理解和重建精度,实验结果表明其在几何一致性和重建保真度方面表现优异。
本研究提出了一种新颖的高斯点云方法,解决了传统高分辨率图像在实时交互中的局限,尤其在稀疏视角下。该方法显著提高了渲染速度并保持几何一致性,实验结果表明其优于现有技术,具有广泛应用潜力。
本研究提出了一种新方法INTEGER,旨在解决无监督点云配准中的优化目标不足问题。通过特征几何一致性挖掘模块,结合上下文信息和几何线索,动态适应教师网络,生成可靠的伪标签。实验结果表明,INTEGER在准确性和普遍性方面表现优异。
本研究提出了一种3D适配器模块,解决了多视角图像扩散模型在3D几何一致性方面的不足。通过注入3D几何意识,显著提升了几何质量,支持多种任务,展现了广泛的应用潜力。
本文介绍了一系列新方法,如LucidDreaming、MIG和Direct3D,旨在提高3D生成的控制能力和质量。这些技术解决了几何不一致性和属性泄漏问题,提升了生成结果的视觉质量和一致性,为用户提供了更大的创作自由度,推动了3D内容创作的进步。
本研究提出多种神经网络方法用于高质量3D表面重建,利用多视角图像、几何一致性和隐式神经渲染等技术,显著提高了重建精度和细节表现,尤其在复杂几何和反射物体的处理上取得了优异成果。
本文介绍了一系列基于多模型匹配和优化算法的视觉重建方法,重点在于提高匹配数量和精度。研究涵盖了从宽基线匹配到无检测器SfM框架的进展,强调了在复杂场景中处理几何一致性和点云匹配的创新,展示了显著的性能提升和应用潜力。
本文介绍了多种三维生成技术,包括基于分数蒸馏的NeRF模型、DragD3D局部网格编辑方法和PolyDiff三维多边形网格生成方法。这些技术通过结合草图风格引导、二维扩散先验和合理性保持,显著提升了三维对象生成的质量和控制能力,解决了几何不一致性问题。
该研究提出了多种神经隐式表面重建方法,利用几何一致性和多视角约束,显著提升室内场景的重建质量。通过引入不确定性建模和深度先验技术,解决了纹理缺乏的问题,实验结果表明其在3D重建中表现优越。
本文介绍了一种新颖的三维生成方法“Consistent3D”,通过GSD框架和姿态相关性蒸馏采样(PCDS),显著提高了文本到三维生成的几何一致性和质量。研究还提出了分类器分数蒸馏(CSD)和稳定评分蒸馏(SSD)等新方法,优化了生成模型的性能,解决了3D模型准确性与文本提示之间的错位问题。实验结果表明,这些方法在生成高保真度和多样性的三维物体方面表现优异。
本文介绍了多种基于扩散模型的三维图像生成方法,如ConsistNet、SyncDreamer和MVDream。这些模型能够从单张图像生成多视角一致的三维图像,解决几何和颜色一致性问题,适用于新视点合成和个性化三维生成。结合文本提示和大规模数据集,这些方法显著提高了生成效果和稳定性。
该论文提出了一种几何一致的神经隐式表面重建方法,结合多视角几何约束和稀疏结构信息,优化有符号距离函数以实现高质量重建。实验结果表明,该方法在速度、泛化性能和灵活性方面表现优越。
本文介绍了通过DreamControl的两阶段2D-lifting框架解决3D生成中的几何不一致性问题,提升了文本到3D生成的可控性。研究提出了Control3D方法,结合手绘草图和文本提示,生成高质量的3D场景,并探讨了人脸合成、3D模型生成及样式编辑等技术,展示了在几何和纹理一致性方面的显著进展。
该研究介绍了多种基于视频扩散模型的3D生成方法,如One-2-3-45++和Envision3D,能够从单张图像快速生成高质量的3D纹理网格和多视图图像。这些方法通过新算法和框架显著提高了生成效率和几何一致性,适用于个性化3D生成和新视角合成。
本文介绍了一种新方法GC-MVSNet,通过鼓励多源视图的几何一致性,加速多视角立体(MVS)学习过程,达到了DTU和BlendedMVS数据集的最新技术水平,并在Tanks and Temples基准上取得了竞争力结果。该方法结合了匹配不确定性估计和几何一致性,显著提高了深度估计的准确性。
完成下面两步后,将自动完成登录并继续当前操作。