字节Seed的康炳易团队推出Depth Anything 3(DA3),该模型利用单一Transformer实现任意视图的3D重建,提升了相机定位和几何重建的准确性。通过简化架构和核心预测,DA3能够从单图、多图或视频中提取深度和光线信息,展现出强大的性能和广泛的应用潜力。
本研究提出了统一框架Aether,旨在解决几何重建与生成建模的挑战。Aether通过联合优化实现几何感知推理,能够在没有真实数据的情况下进行零样本泛化,其重建性能超越领域特定模型,展现出在物理建模中的潜力。
本文提出了一个结合传统相机姿态优化与可逆神经渲染的框架,利用Nerfels进行3D场景表示。该模型通过优化代码调节机制有效概括未见局部区域,保持低内存占用。研究还介绍了多种基于神经辐射场的增强方法,提升了新视角合成和几何重建的表现,展示了在大规模场景重建中的优势。
该论文介绍了多个基于机器学习的CAD设计方法,包括SketchGraphs数据集和生成模型SketchGen,旨在提高几何设计图的参数化和约束预测能力。研究提出的新框架和模型,如CAD-SIGNet和PS-CAD,显著改善了设计历史恢复和几何重建效果,推动了计算机辅助设计领域的发展。
该研究利用计算机图形技术改进面部3D建模,提出多种新方法以提高几何和反射的重建质量。通过自监督学习和协同过程,成功从稀疏视图重建高质量面部模型,展示了优越的性能和应用潜力。
本研究提出了三角补丁(Triplet)框架,旨在提高逆渲染中场景物理属性推导的准确性。该方法通过随机生成点或稀疏点组装Triplets,并结合传统渲染技术进行优化,显著提升了光、材料和几何参数的估计精度,实验结果表明其在视觉质量和几何重建方面达到了先进水平。
本文介绍了一种新颖的3D虚拟服装建模方法,利用多任务学习网络和语义部件提取纹理信息,提升虚拟试穿的准确性和速度。同时,研究提出了动态人体重建和高质量几何重建的新技术,展示了在服装细节和交互建模方面的进展。
本文提出了一种新型逆向渲染方法GS-IR,利用3D高斯零碎描绘和前向映射体积渲染,实现新视角合成和重新照明。该方法通过捕捉多视图图像,估计场景几何和材质,克服了以往方法的局限性,并引入深度推导的法线估计和遮挡模拟,优化了逆向渲染过程,展现出在几何重建和渲染质量上的优越性。
本文介绍了一种新方法,通过无监督学习实现3D关键点推断,适用于噪声、降采样和旋转场景。该方法在未标注数据集上表现良好,具有较低的关键点位置误差和语义一致性,适用于少样本学习和3D几何重建。实验结果显示,该方法在多个数据集上显著提升了性能。
该论文探讨了多种3D形状表示方法,如DeepSDF、Mosaic-SDF和SurroundSDF,旨在提升几何重建的质量和效率。这些方法通过无监督学习和创新的优化技术,在3D形状生成和重建任务中表现优异,展现了在实时渲染和复杂形状处理方面的先进性能。
本文提出了多种优化的3D高斯技术,包括EfficientGS和CompGS,显著降低了模型大小和渲染时间,同时保持高渲染质量。研究还介绍了基于高斯裁剪的几何重建方法和改进的3D高斯光斑模型,提升了训练效率和视觉效果,并通过内存优化和紧凑场景表示,进一步减少了存储需求和提高了渲染速度,展示了方法的鲁棒性和有效性。
本文介绍了火山引擎多媒体实验室自研的三维重建技术在智能驾驶系统中的应用,解决了驾驶场景重建技术中的多个难点,包括静态场景重建、动态物体重建和神经辐射场重建技术。同时,文章还介绍了使用神经辐射场技术进行隐式重建的方法,并结合自研动静态分割、影子检测等算法对场景进行处理,实现了高精度的几何重建。
该论文提出了一种基于梯度的元学习算法,用于神经隐式形状表示,实现从部分或噪声观测数据中进行的几何重建。该方法比自动编码器的方法快一个数量级,并超过了基于编码器-解码器的池化网络集合编码器方法。
该论文介绍了神经隐式形状表示的概念,提出了一种基于梯度的元学习算法,以提高形状空间的泛化能力,实现从部分或噪声观测数据中进行的几何重建。该方法比自动编码器的方法快一个数量级,并超过了基于编码器-解码器的池化网络集合编码器方法。
完成下面两步后,将自动完成登录并继续当前操作。