DarSwin-Unet: 扭曲感知编码器 - 解码器结构

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种基于径向变换器架构的编码器 - 解码器模型,适应宽角镜头的畸变,并在像素级任务中表现出更强的能力。通过实验证明了其在深度估计中的性能,并且可以适应不同广角镜头的未知畸变。

🎯

关键要点

  • 本文介绍了一种基于径向变换器架构的编码器 - 解码器模型。

  • 该模型适应宽角镜头的畸变,表现出更强的像素级任务能力。

  • 提供了一种增强在广角鱼眼图像中处理像素级任务效果的方法。

  • 相较于其他基线模型,在不同数据集上表现出了最佳结果。

  • 在受限程度的畸变训练和包括非分布畸变的测试中均取得了显著增益。

  • 通过广泛的实验证明了其在深度估计中的性能。

  • 该模型可以零次适应不同广角镜头的未知畸变。

➡️

继续阅读