DiRecNetV2：一种增强型变换网络用于航空灾害识别

本研究解决了无人机（UAV）在灾害评估中的图像处理模型缺乏全球上下文理解的问题。提出的DiRecNetV2是一种结合卷积神经网络和变换器层的混合模型，既保留了局部特征提取的优点，又实现了高效的全球上下文解读。研究表明该模型在单标签测试集上获得了0.964的加权F1分数，并在复杂的多标签测试集中达到0.614，展示了其在UAV应用中的高效性和灵活性。

机器学习的计算机视觉模型在自然灾害后的应急管理中有潜力。空中照片用于情境感知和损伤评估，但筛选相关图像有挑战。LADI v2数据集包含2015至2023年约10,000张灾害图像，经过多标签分类注释。预训练基线分类器与先进图像-语言模型进行性能比较，数据和代码已公开支持研究。

LADI v2 图像分类机器学习自然灾害计算机视觉