上海AI Lab与西工大提出的CityGS-X架构,通过并行化混合层次三维表征(PH²-3D),实现高效的城市场景重建,提升训练速度和几何精度,解决传统3D重建的算力瓶颈,支持4090显卡的大规模渲染。
中科院自动化所研究团队提出的CityGaussianV2算法,旨在高效重建大规模复杂三维场景。该算法结合2DGS的优点,优化训练和压缩过程,显著提升几何精度和渲染质量,同时降低显存开销。实验结果表明,CityGaussianV2在多个数据集上表现优异,推动了大规模场景重建技术的发展。
该研究提出G3Flow框架,解决3D机器人操作中的几何精度与语义理解整合问题。通过实时构建动态物体中心的三维语义流,结合3D生成模型和视觉基础模型,提升了在遮挡条件下的语义理解和跨物体泛化能力,显著提高了操作成功率。
本研究提出了MVLight,一个新型的光条件多视图扩散模型,解决了文本到3D生成中光独立与光依赖组件的解耦问题。MVLight能够将光照条件整合到生成过程中,显著提升几何精度和重光照能力。
当前的3D GAN反演方法通常只用一个正面图像重建3D头部模型,忽略多视角信息。本研究改进了这一技术,允许同时反演多个视角,处理动态视频中的不一致性,合成一致的3D表示。结果显示,在几何精度和图像质量上有显著提升,尤其在宽视角下,并展示了3D渲染的可编辑性。
完成下面两步后,将自动完成登录并继续当前操作。