ODTFormer:基于 Transformer 的立体相机高效障碍物检测和跟踪

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

ODTFormer是一种基于Transformer的模型,用于解决障碍物检测和跟踪问题。通过利用可变形注意力构建三维成本体积,以体素占用栅格的形式逐渐解码来进行检测任务。在实验证明,ODTFormer在障碍物检测任务中达到了最先进的性能,并且计算成本比最先进的障碍物跟踪模型少十到二十倍。

🎯

关键要点

  • ODTFormer是一种基于Transformer的模型,专注于障碍物检测和跟踪。
  • 模型利用可变形注意力构建三维成本体积,以体素占用栅格的形式逐渐解码进行检测。
  • 通过匹配连续帧之间的体素来实现障碍物跟踪。
  • 在DrivingStereo和KITTI基准上进行的广泛实验表明,ODTFormer在障碍物检测任务中表现出最先进的性能。
  • ODTFormer的计算成本比最先进的障碍物跟踪模型低十到二十倍。
  • 代码和模型权重将被公开发布。
🏷️

标签

➡️

继续阅读