小红花·文摘 - 小红花技术领袖俱乐部

3D基础模型时代开启？Meta与牛津大学推出VGGT，一站式Transformer开创高效3D视觉新范式

3D基础模型时代开启？Meta与牛津大学推出VGGT，一站式Transformer开创高效3D视觉新范式

机器之心 ·

该研究提出了一种高效通用的解决方案，解决了文本到图像生成中相机控制不精确的问题。通过四个相机参数，研究展示了一个包含57,000多幅图像及其文本提示和相机参数的新数据集，并证明了该方法在生成图像时实现了更精准的相机控制。

PreciseCam: Precise Camera Control for Text-to-Image Generation

BriefGPT - AI 论文速递 ·

本研究提出了FreeSplatter框架，解决了稀疏视图重建中相机姿态不足的问题。该框架通过无标定稀疏视图生成高质量三维表示，并快速恢复相机参数，优于现有方法。

FreeSplatter: Unconstrained Gaussian Splatter for Sparse View 3D Reconstruction

BriefGPT - AI 论文速递 ·

OpenIllumination是一个包含108k多个真实世界图像的数据集，可用于评估反渲染和材料分解方法。数据集提供了每个图像的相机参数、光照真值和前景分割掩码。

斯坦福 - ORB: 三维物体逆向渲染实际世界基准

BriefGPT - AI 论文速递 ·