小红花·文摘

本文介绍了一种新型大规模重建模型（LRM），能够在5秒内从单个图像预测3D模型。LRM基于transformer架构，训练于约100万个对象的数据集，具备强大的通用性和高质量重建能力。此外，文中提到的GRM和EfficientGS等新方法和模型，旨在提升3D重建的效率和质量，展示了在稀疏视图下的优越性能。

长序列大重建模型用于广覆盖高斯点云

BriefGPT - AI 论文速递 ·

通过引入跨视图一致的交叉注意力机制和利用三维先验信息，提出了一种高效的多视角大型重建模型 (M-LRM)，能够从多视图中以三维感知的方式高质量地重建三维形状，并且相比于 LRM 能够生成分辨率为 $128 imes 128$ 的三平面 NeRF，具有更高的保真度和训练收敛速度。

M-LRM: 多视角大重建模型

BriefGPT - AI 论文速递 ·

我们提出了一个大规模重建模型（LRM），可以在5秒内从单个输入图像预测对象的3D模型。该模型采用了一个高度可扩展的基于transformer的架构，并在包含大约100万个对象的海量多视图数据上进行了训练。该模型具有很强的通用性，并能够生成高质量的3D重建结果。

TripoSR：快速从单张图像重建三维对象

BriefGPT - AI 论文速递 ·

我们提出了一个大规模重建模型（LRM），可以在5秒内从单个输入图像预测对象的3D模型。该模型采用了高度可扩展的transformer架构，并在大约100万个对象的多视图数据上进行了训练。模型通用性强，生成高质量的3D重建结果。

使用大型重建模型进行单视角三维人体数字化

BriefGPT - AI 论文速递 ·

我们提出了一种无姿势大重建模型（PF-LRM），可以从少数非姿势图像中重建三维物体，同时在单个A100 GPU上估计相机姿势，仅需约1.3秒。PF-LRM利用自注意力块在三维物体标记和二维图像标记之间交换信息，具有强大的泛化能力，并在未见评估数据集上超越基线方法。模型适用于下游文本/图像到三维任务，并具有快速的前馈推理。

PF-LRM：用于联合姿态和形状预测的无姿态大型重建模型

BriefGPT - AI 论文速递 ·

LRM是一个大规模重建模型，可以在5秒内从单个输入图像预测对象的3D模型。该模型采用高度可扩展的transformer架构，在包含大约100万个对象的海量多视图数据上进行端到端训练。该模型具有很强的通用性，并能够从各种测试输入中生成高质量的3D重建结果。

LRM：单幅图像到 3D 的大规模重建模型

BriefGPT - AI 论文速递 ·