UniTT-Stereo:统一训练变换器以增强立体匹配

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了AAUformer网络,通过平衡外极线的影响,实现了出色的泛化性能。该模型引入了窗口自注意力和多尺度交替注意力骨干网络,解放了像素级单视图的局部语义特征,并在多个数据集上进行了比较和消融研究,证明了其在场景流数据集上达到了最先进的效果。在KITTI 2015数据集上的微调性能也具有竞争力,并在合成和实际数据集上的交叉泛化实验中优于其他方法。

🎯

关键要点

  • 提出了一种名为AAUformer的高效网络。
  • 通过平衡外极线的影响,实现了出色的泛化性能。
  • 引入窗口自注意力和多尺度交替注意力骨干网络。
  • 解放了像素级单视图的局部语义特征。
  • 在场景流数据集上达到了最先进的效果。
  • 在KITTI 2015数据集上的微调性能具有竞争力。
  • 在合成和实际数据集上的交叉泛化实验中优于其他方法。
➡️

继续阅读