小红花·文摘

字节Seed的康炳易团队推出Depth Anything 3（DA3），该模型利用单一Transformer实现任意视图的3D重建，提升了相机定位和几何重建的准确性。通过简化架构和核心预测，DA3能够从单图、多图或视频中提取深度和光线信息，展现出强大的性能和广泛的应用潜力。

谢赛宁盛赞字节Seed新研究！单Transformer搞定任意视图3D重建

量子位 ·

本研究提出了统一框架Aether，旨在解决几何重建与生成建模的挑战。Aether通过联合优化实现几何感知推理，能够在没有真实数据的情况下进行零样本泛化，其重建性能超越领域特定模型，展现出在物理建模中的潜力。

艾瑟：几何感知统一世界建模

BriefGPT - AI 论文速递 ·

本文提出了一个结合传统相机姿态优化与可逆神经渲染的框架，利用Nerfels进行3D场景表示。该模型通过优化代码调节机制有效概括未见局部区域，保持低内存占用。研究还介绍了多种基于神经辐射场的增强方法，提升了新视角合成和几何重建的表现，展示了在大规模场景重建中的优势。

将 NeRFs 引入潜在空间：逆图形自编码器

BriefGPT - AI 论文速递 ·

该论文介绍了多个基于机器学习的CAD设计方法，包括SketchGraphs数据集和生成模型SketchGen，旨在提高几何设计图的参数化和约束预测能力。研究提出的新框架和模型，如CAD-SIGNet和PS-CAD，显著改善了设计历史恢复和几何重建效果，推动了计算机辅助设计领域的发展。

DAVINCI：一种用于受限CAD草图推理的单阶段架构

BriefGPT - AI 论文速递 ·

该研究利用计算机图形技术改进面部3D建模，提出多种新方法以提高几何和反射的重建质量。通过自监督学习和协同过程，成功从稀疏视图重建高质量面部模型，展示了优越的性能和应用潜力。

面部建模中的眼睑褶皱一致性

BriefGPT - AI 论文速递 ·

本研究提出了三角补丁（Triplet）框架，旨在提高逆渲染中场景物理属性推导的准确性。该方法通过随机生成点或稀疏点组装Triplets，并结合传统渲染技术进行优化，显著提升了光、材料和几何参数的估计精度，实验结果表明其在视觉质量和几何重建方面达到了先进水平。

Triplet: Triangle Patch for Mesh-Based Inverse Rendering and Scene Parameter Approximation

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的3D虚拟服装建模方法，利用多任务学习网络和语义部件提取纹理信息，提升虚拟试穿的准确性和速度。同时，研究提出了动态人体重建和高质量几何重建的新技术，展示了在服装细节和交互建模方面的进展。

高斯服装:从多视角视频中重建具有逼真外观的仿真准备服裠

BriefGPT - AI 论文速递 ·

本文提出了一种新型逆向渲染方法GS-IR，利用3D高斯零碎描绘和前向映射体积渲染，实现新视角合成和重新照明。该方法通过捕捉多视图图像，估计场景几何和材质，克服了以往方法的局限性，并引入深度推导的法线估计和遮挡模拟，优化了逆向渲染过程，展现出在几何重建和渲染质量上的优越性。

热红外新视角合成的物理驱动3D高斯模型

BriefGPT - AI 论文速递 ·

本文介绍了一种新方法，通过无监督学习实现3D关键点推断，适用于噪声、降采样和旋转场景。该方法在未标注数据集上表现良好，具有较低的关键点位置误差和语义一致性，适用于少样本学习和3D几何重建。实验结果显示，该方法在多个数据集上显著提升了性能。

SelfGeo：自主训练和地球一致性的可变形形状关键点估计

BriefGPT - AI 论文速递 ·

该论文探讨了多种3D形状表示方法，如DeepSDF、Mosaic-SDF和SurroundSDF，旨在提升几何重建的质量和效率。这些方法通过无监督学习和创新的优化技术，在3D形状生成和重建任务中表现优异，展现了在实时渲染和复杂形状处理方面的先进性能。

VortSDF: 以质心 Voronoi 图在有符号距离场上进行的三维建模

BriefGPT - AI 论文速递 ·

本文提出了多种优化的3D高斯技术，包括EfficientGS和CompGS，显著降低了模型大小和渲染时间，同时保持高渲染质量。研究还介绍了基于高斯裁剪的几何重建方法和改进的3D高斯光斑模型，提升了训练效率和视觉效果，并通过内存优化和紧凑场景表示，进一步减少了存储需求和提高了渲染速度，展示了方法的鲁棒性和有效性。

修剪肥胖：通过修剪压缩 3D 高斯点云

BriefGPT - AI 论文速递 ·

本文介绍了一种基于3D高斯模型的语义分割和渲染方法，显著提升了实时性能和分割质量。通过2D基础模型蒸馏3D特征，提出了LangSplat和SA-GS等新技术，优化了3D场景表示和查询效率，推动了语义理解和几何重建的进展。

Fast LGS: Accelerating Language-Embedded Gaussian through Feature Grid Mapping

BriefGPT - AI 论文速递 ·

本文介绍了一种基于层次高斯化身（LayGA）的方法，能够从多视角视频中生成可动的虚拟服装和人体模型。该方法在几何重建和真实感渲染方面表现优越，能够高效处理动态人体重建，并在多个数据集上验证了其效果。通过高斯喷洒技术，模型在渲染速度和质量上均有显著提升，适用于实时应用。

LAGA: 分层 3D 角色生成与定制

BriefGPT - AI 论文速递 ·

Sparse3D 是一种新型三维重建方法，利用图像扩散模型提取 2D 先验，提升开放世界对象的重建质量。通过 C-SDS 技术增强细节，实验证明其在 NVS 和几何重建方面优于现有技术，显著提高 3D 重建性能。

ICCV 2023 OmniObject3D 挑战赛第 1 名解决方案：稀疏视图重建

BriefGPT - AI 论文速递 ·

本文介绍了多种3D风格转移技术，如StyleRF、S-DyRF和MM-NeRF，重点在于几何重建、风格化质量和动态场景处理的创新。通过神经辐射场（NeRF）和多模态特征，实现了高质量的3D场景风格转移，提升了视觉效果和一致性，并展现了灵活的风格控制能力。

StyleDyRF：0 增动态神经辐射场的零迁移

BriefGPT - AI 论文速递 ·

本文介绍了火山引擎多媒体实验室自研的三维重建技术在智能驾驶系统中的应用，解决了驾驶场景重建技术中的多个难点，包括静态场景重建、动态物体重建和神经辐射场重建技术。同时，文章还介绍了使用神经辐射场技术进行隐式重建的方法，并结合自研动静态分割、影子检测等算法对场景进行处理，实现了高精度的几何重建。

云上智能驾驶三维重建最佳实践

字节跳动技术团队官方博客 ·

该论文提出了一种基于梯度的元学习算法，用于神经隐式形状表示，实现从部分或噪声观测数据中进行的几何重建。该方法比自动编码器的方法快一个数量级，并超过了基于编码器-解码器的池化网络集合编码器方法。

神经距离场的零级集编码器

BriefGPT - AI 论文速递 ·

该论文介绍了神经隐式形状表示的概念，提出了一种基于梯度的元学习算法，以提高形状空间的泛化能力，实现从部分或噪声观测数据中进行的几何重建。该方法比自动编码器的方法快一个数量级，并超过了基于编码器-解码器的池化网络集合编码器方法。

利用有限样本在神经表示上估计形状距离

BriefGPT - AI 论文速递 ·