LT-ViT:用于多标签胸部 X 射线分类的视觉 Transformer
原文中文,约200字,阅读约需1分钟。发表于: 。利用 LT-ViT 来从多个尺度聚合信息,实现对胸部 X 光图像进行纯可视化模型训练,其优于基于纯 ViTs 的现有方法,在两个公开 CXR 数据集上表现出最先进的性能,并且对于其他预训练方法具有泛化性且不依赖于模型初始化,并且能够实现模型的可解释性而无需使用 grad-cam 及其变种。
本论文提出了一种创新的 Vision Transformer 算法,用于诊断和量化 COVID-19 的严重程度。实验结果显示,该模型具有卓越的泛化能力和最先进的性能。