DiRecNetV2:一种增强型变换网络用于航空灾害识别
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了无人机(UAV)在灾害评估中的图像处理模型缺乏全球上下文理解的问题。提出的DiRecNetV2是一种结合卷积神经网络和变换器层的混合模型,既保留了局部特征提取的优点,又实现了高效的全球上下文解读。研究表明该模型在单标签测试集上获得了0.964的加权F1分数,并在复杂的多标签测试集中达到0.614,展示了其在UAV应用中的高效性和灵活性。
机器学习的计算机视觉模型在自然灾害后的应急管理中有潜力。空中照片用于情境感知和损伤评估,但筛选相关图像有挑战。LADI v2数据集包含2015至2023年约10,000张灾害图像,经过多标签分类注释。预训练基线分类器与先进图像-语言模型进行性能比较,数据和代码已公开支持研究。