本文提出了一种自监督学习方案,以提高无人机在无GPS环境中的自我运动估计能力。通过改进遮挡处理方法,显著提升了无人机在高速飞行和接近障碍物时的视觉识别准确性,增强了实际应用表现。
本研究提出了一种新颖的事件增强网络Ev-DeblurVSR,旨在解决模糊视频超分辨率问题。通过融合帧与事件信息,该方法显著提高了运动估计和去模糊效果,实验证明在真实数据上准确性提升2.59 dB,速度提高7.28倍。
该研究提出了一种名为V$^2$-SfMLearner的新方法,结合振动信号与视觉信号,以提高胶囊内窥镜视频中的深度和运动估计准确性,有效消除振动干扰,提升消化系统检查的实时性和可靠性。
本研究提出OmniDrag方法,解决全向视频生成中的内容不准确和不一致问题,尤其在复杂球形运动场景中。通过新颖的运动估计器和Move360数据集,显著提升了生成的准确性和质量。
本研究提出了一种基于残差的光流估计方法,有效解决了事件摄像头在高时间分辨率下运动估计的数据稀疏性问题,显著提高了准确性。
本文提出了AsynEIO模型,旨在融合异步事件相机与惯性传感器以提高运动估计的精度。该模型基于高斯过程回归,结合事件驱动前端和惯性因子,实现高效的运动轨迹追踪与优化。实验结果表明,AsynEIO在高速度和低光照条件下表现优于现有方法,具有实际应用价值。
该论文探讨了事件相机与标准相机结合的低延迟视觉特征跟踪方法,提出了多种基于事件流的图像重建和处理技术,显著提高了图像质量和运动估计的稳定性,适用于实时应用。
本文介绍了多种先进的多模态融合框架,如FusionPainting、BiProDet和CMDFusion,旨在提升3D障碍物检测性能。这些方法通过融合2D RGB图像和3D点云,优化了检测精度,并在多个基准测试中表现优异。研究表明,3D检测在路径规划和运动估计中比2D检测更为准确。
本文介绍了一种新的视频序列运动估计方法,利用全局一致的运动表示和双向对应实现像素级跟踪,确保全局一致性并处理遮挡。此外,文中还探讨了自监督学习3D运动和深度的方法,以及基于深度神经网络的未来帧预测技术,这些方法在多个数据集上表现优异。
该研究提出了一种无监督学习方法,利用SE(3)等变特征进行刚体分割和运动估计,显著提升了模型的效率和性能。通过深度神经网络,研究了非刚性运动结构恢复,展示了优越的精度和鲁棒性,并在多个数据集上验证了其有效性。
本文介绍了一种基于在线学习和神经网络的轮式编码器校正方法,旨在提高机器人的定位准确性。该方法相比传统算法具有明显优势,无需耗时的数据收集。同时,提出了ST-VIO方法,结合动力学模型与视觉惯性测距,实现不同环境中的准确运动估计和预测。此外,研究还探讨了LiDAR与视觉SLAM的融合框架,提升了移动机器人在复杂环境中的导航能力。
本文探讨了事件相机在运动估计中的应用,提出了一种非线性参数化方法和新型求解器,以提高相对运动估计的稳定性和准确性。同时,研究了基于多尺度特征融合的视频帧插值方法,展示了其在鲁棒性和效率上的优势。实验结果验证了所提算法的有效性。
本文提出了一种新的方法,通过引入基于梯度的优化算法,利用 Cone-beam CT 的几何结构的广义导数,加快了运动估计的速度,提高了准确性,并在临床工作流中集成了 CBCT,解决了时效性场景中的关键挑战。
本文介绍了一种名为自适应图推理的光流图算法,通过利用场景信息和上下文信息,提高了运动估计的鲁棒性和准确性。在Sintel干净和最终通行证上,其EPE分别为1.43和2.47像素,比现有技术提高了11.2%和13.6%。
本文介绍了一种新的运动估计方法MaskFlow,能够准确估计小目标、大位移和外观剧变情况下的运动场。通过利用物体级特征和分割,MaskFlow近似物体的平移运动场,并提出了一种有效的方法将不完整的平移运动场结合到后续的运动估计网络中进行精化和补全。作者还提供了一个具有运动场Ground Truth的新的挑战性合成数据集,并为对象实例匹配和相应分割掩码提供了额外的Ground Truth。实验证明,MaskFlow在新的挑战性数据集上优于现有方法,并且在FlyingThings3D基准数据集上也能产生可比较的结果。
完成下面两步后,将自动完成登录并继续当前操作。