本研究提出了Endo3DAC框架,旨在提高内窥镜三维场景重建中的自监督学习效率。通过冻结基础模型并训练新设计的GDV-LoRA,显著提升了深度和姿态估计的准确性,同时保持训练效率。
本研究提出了一系列基于扩散模型的3D生成方法,结合深度先验和生成约束,提升了三维场景重建的质量和效率。新方法如IB-planes和latentSplat在多视图图像生成和重建中表现优越,显著降低了训练成本并提高了生成速度,适用于复杂场景。
本文介绍了一种基于事件相机的实时视觉里程计解决方案,结合视觉一致性和三维场景重建,能够在高速动态场景中有效运行。研究提出了运动补偿图像重建和视觉惯性导航融合等方法,显著提高了姿态估计的准确性。实验结果表明,该系统在多个数据集上优于现有技术。
本文介绍了语义场景补全(SSC)技术的最新进展,包括点-体素聚合网络、深度卷积神经网络SSCNet和自我监督方法S4C等。这些方法在多个基准测试中表现优越,有效捕捉3D场景的语义信息和结构细节,推动了基于单目摄像机的三维场景重建研究。
该研究利用光场相机拍摄的单幅图像进行三维场景重建,利用光场中的三维信息线索和滚动快门效应提供的运动信息,提供了一个通用模型和两阶段算法。实验结果表明该方法有效。
本文介绍了使用事件相机实现实时视觉里程计的解决方案,成功解决了半密集三维场景重建和姿态恢复问题。该系统在高速和大动态范围场景下进行视觉里程计,并在公开数据集和作者的数据集上进行了测试。
本文介绍了使用事件相机实现实时视觉里程计的解决方案。该系统通过立体事件数据融合进行三维场景重建,并通过地图和事件数据表示解决姿态恢复问题。该系统在高速和大动态范围场景下成功进行了视觉里程计,并在标准CPU上实时运行。已在公开数据集和作者的数据集上进行了测试。
完成下面两步后,将自动完成登录并继续当前操作。