SugarViT -- 基于视觉 Transformer 和深度标签分布学习的无人机图像多目标回归在甜菜病害严重性预测中的应用

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文使用新的视觉Transformer模型在加纳的广泛景观上进行优化,实现了比以前使用的卷积方法更高的准确度。ViT模型的高度图具有更好的地面采样距离和更好的稀疏植被灵敏度,其RMSE仅为3.12m。

🎯

关键要点

  • 本文使用新的视觉Transformer模型在加纳的广泛景观上进行优化。
  • 优化了分类(离散)和回归(连续)损失函数。
  • 实现了比以前使用的卷积方法更高的准确度。
  • 提出的离散/连续损失显著提高了对非常高的树(即 > 35m)的灵敏度。
  • ViT模型的高度图具有更好的地面采样距离和更好的稀疏植被灵敏度。
  • 与卷积模型相比,ViT模型的RMSE仅为3.12m。
➡️

继续阅读