本研究提出了Endo3DAC框架,旨在提高内窥镜三维场景重建中的自监督学习效率。通过冻结基础模型并训练新设计的GDV-LoRA,显著提升了深度和姿态估计的准确性,同时保持训练效率。
本研究提出了一系列基于扩散模型的3D生成方法,结合深度先验和生成约束,提升了三维场景重建的质量和效率。新方法如IB-planes和latentSplat在多视图图像生成和重建中表现优越,显著降低了训练成本并提高了生成速度,适用于复杂场景。
本文提出了一种新方法,用于从稀疏多视角图像重建三维场景和对象。该方法利用嵌入在多视角输入中的场景属性,创建精确的伪标签进行优化,无需先验训练。通过利用球谐函数预测场景中点的新辐射,综合考虑所有颜色观察结果,提高稀疏视图的表面重建准确性。方法在DTU和Blender数据集上取得优越结果,展示了其在解决稀疏视图重建问题方面的有效性。流程可集成到其他稀疏视图的隐式神经重建方法中。
该研究提出了一种利用滚动快门传感器的光场相机拍摄的图像进行三维场景重建的方法。通过利用光场中的三维信息线索和滚动快门效应提供的运动信息,该方法能够最小化重新投影误差,并提供一种瞬时的三维形状-姿态-速度感知范例。研究还提供了一个新的基准数据集,用于评估和跟踪该领域的进展。
该研究利用光场相机拍摄的单幅图像进行三维场景重建,利用光场中的三维信息线索和滚动快门效应提供的运动信息,提供了一个通用模型和两阶段算法。实验结果表明该方法有效。
本文介绍了使用事件相机实现实时视觉里程计的解决方案,成功解决了半密集三维场景重建和姿态恢复问题。该系统在高速和大动态范围场景下进行视觉里程计,并在公开数据集和作者的数据集上进行了测试。
本文介绍了使用事件相机实现实时视觉里程计的解决方案。该系统通过立体事件数据融合进行三维场景重建,并通过地图和事件数据表示解决姿态恢复问题。该系统在高速和大动态范围场景下成功进行了视觉里程计,并在标准CPU上实时运行。已在公开数据集和作者的数据集上进行了测试。
完成下面两步后,将自动完成登录并继续当前操作。