该研究提出了一种新的增强对比学习方法,结合多视角图像和纵向数据,解决胸部X光报告生成中的诊断准确性不足问题。实验结果表明,该方法在多个数据集上超越现有技术,显著提升报告生成的准确性。
本研究提出了一种新方法Plane-DUSt3R,旨在解决多视角图像中的房间布局估计问题。该方法利用3D模型DUSt3R进行高效估计,效果优于现有技术。
AIxiv专栏促进学术交流,报道超过2000篇文章。北航、VAST和上海交大团队推出MV-Adapter,解决多视角图像生成问题,支持768分辨率,提升生成质量和一致性,适用于多种应用。
本研究提出了一种新颖的基于图的框架,能够从未校准的多视角图像中自动提取语义对象并生成二维地图,解决了手动标注效率低和准确性差的问题。在强视角变化下,该方法仍能保持4米以内的平均精度。
本文介绍了一种名为NoPoSplat的前馈模型,该模型能够从稀疏无姿态的多视角图像中重建3D场景。它仅使用光度损失进行训练,实现实时3D高斯重建,且无需准确的姿态输入,显著提高了重建质量和精度。
本研究提出了一种3D适配器模块,解决了多视角图像扩散模型在3D几何一致性方面的不足。通过注入3D几何意识,显著提升了几何质量,支持多种任务,展现了广泛的应用潜力。
本研究提出多种神经网络方法用于高质量3D表面重建,利用多视角图像、几何一致性和隐式神经渲染等技术,显著提高了重建精度和细节表现,尤其在复杂几何和反射物体的处理上取得了优异成果。
本文介绍了一种新颖的生成静态和关节3D资产的方法,利用3D自解码器框架学习属性并渲染一致的外观。该方法在无摄像头信息的情况下,通过多视角图像学习几何感知的身体表示,显著提高了姿态估计性能,并在少量标记数据下超越了传统方法。
本文探讨了单目三维人体网格恢复的任务,分析了身体模型、恢复框架和评估指标,比较了优化与回归方法的优缺点。提出了一种基于深度图和多视角图像的创新技术,能够从单张图像中快速准确地重建3D人体形状,有效解决多人姿态和遮挡问题,展示了良好的性能和应用潜力。
本文提出了一种新方法,通过预训练的文字转图像模型生成多视角图像,结合3D体渲染和跨帧注意力层,显著提升3D图像的一致性和视觉质量。研究表明,该方法在3D物体重建上优于现有技术,减少了误差并提高了性能。
本文介绍了多种基于相机的3D场景理解方法,如PanoOcc、DepthSSC和SelfOcc。这些方法通过聚合多视角图像信息,提升了语义分割和占用预测的性能,尤其在自动驾驶应用中表现优异。实验结果表明,这些新方法在多个数据集上均优于现有技术,推动了3D场景理解研究的发展。
本文介绍了多种3D生成对抗网络(GAN)方法的进展,如SideGAN、MVCGAN和BallGAN,旨在提升3D图像合成的质量和一致性。研究通过几何约束和混合训练策略,解决了多视角图像生成中的挑战,并展示了在3D感知图像编辑和重建方面的创新成果。
本文介绍了一种基于特征体积的实时密集重建方法,该方法通过稀疏深度特征体积预测TSDF值,并利用多视角图像聚合细节,实现高分辨率三维重建。该方法在室内外场景中展现了优越的实时重建性能。
MVG-NeRF结合传统多视角几何与神经辐射场(NeRF)进行三维重建,利用像素级深度和法线优化表面质量。该方法通过多视角图像恢复场景的表面、材质和光照,能够有效处理复杂照明条件下的高光反射,显著提升建模效果。实验结果表明,该方法在新视角合成和再照明应用中表现优越。
完成下面两步后,将自动完成登录并继续当前操作。