CrisisViT:一种适用于危机图像分类的稳健视觉 Transformer
发表于: 。利用最新的深度神经模型,通过将基于 Transformer 的架构应用于危机图像分类(CrisisViT),以解决利用社交媒体的公民新闻来帮助危机响应的问题,并通过实验证明,CrisisViT 模型在紧急类型、图像相关性、人道主义类别和损害严重性分类方面明显优于以前的方法。此外,新的 Incidents1M 数据集进一步增强了 CrisisViT 模型,使其准确率提高了 1.25%。
利用最新的深度神经模型,通过将基于 Transformer 的架构应用于危机图像分类(CrisisViT),以解决利用社交媒体的公民新闻来帮助危机响应的问题,并通过实验证明,CrisisViT 模型在紧急类型、图像相关性、人道主义类别和损害严重性分类方面明显优于以前的方法。此外,新的 Incidents1M 数据集进一步增强了 CrisisViT 模型,使其准确率提高了 1.25%。