可解释的视觉 Transformer 结合支持向量机的高效干旱胁迫识别
原文中文,约400字,阅读约需1分钟。发表于: 。提出了一种可解释的深度学习流程,利用视觉变换器(ViTs)从航空图像中提取空间特征,并通过支持向量机(SVM)和专用分类层的协同组合或直接检测干旱应激,以实现马铃薯作物的干旱应激检测,同时可视化关注图说明了 ViT 模型的决策过程,并揭示了与干旱应激相关的植物特征,为农民提供了一个可靠且可解释的解决方案,以改善作物管理并进行决策。
本研究比较了卷积神经网络(CNN)和视觉Transformer(ViT)在服装分类中的应用。研究发现,CNN是图像分类的基石,而ViT引入了自注意机制,可以对不同输入数据进行细致加权。研究还探讨了使用这两种架构的最新方法,以确定在电子商务中对时尚MNIST数据集进行图像分类的最佳架构。研究强调了将这两种架构以不同形式结合的重要性,以提高整体性能。