本研究提出了EarthMapper自回归框架,解决卫星图像与地图的像素对齐问题。通过地理坐标嵌入和多尺度特征对齐,该方法提升了视觉真实感和语义一致性,促进了城市规划和灾后响应的应用发展。
本研究提出了一种新型机器人视觉系统,解决了RGB与NIR成像系统之间的像素对齐问题。通过结合像素对齐的RGB-NIR立体相机与LiDAR传感器,实验结果表明在复杂光照条件下,视觉模型的性能显著提升。
本研究提出了一种新方法,通过在潜视频扩散模型的VAE解码器中引入跨视图注意力层,解决了单幅图像生成多视图时的像素级失配问题。实验结果表明,该方法有效提升了多视图图像的像素对齐效果,改善了3D重建任务的表现。
完成下面两步后,将自动完成登录并继续当前操作。