CheXFusion: 多视角特征有效融合用于长尾胸部 X 射线分类的转换器
原文中文,约300字,阅读约需1分钟。发表于: 。本研究通过引入 CheXFusion,一个基于 transformer 的融合模块,结合多视图图像处理,通过自注意力和交叉注意力机制,高效聚合多视图特征并考虑标签的共现作用,进一步探索数据平衡和自训练方法以提高模型性能,在 MIMIC-CXR 测试集中取得了 0.372 mAP 的最先进结果,并在竞赛中获得第一名,突显了在医学图像分类中考虑多视图设置、类别不平衡和标签共同出现的重要性。
本研究通过引入基于transformer的CheXFusion融合模块,结合多视图图像处理,利用自注意力和交叉注意力机制,高效聚合多视图特征并考虑标签的共现作用。同时,探索数据平衡和自训练方法以提高模型性能。在MIMIC-CXR测试集中,取得了0.372 mAP的最先进结果,并在竞赛中获得第一名,突显了在医学图像分类中考虑多视图设置、类别不平衡和标签共同出现的重要性。