小红花·文摘

本研究通过引入基于transformer的CheXFusion融合模块，结合多视图图像处理，利用自注意力和交叉注意力机制，高效聚合多视图特征并考虑标签的共现作用。同时，探索数据平衡和自训练方法以提高模型性能。在MIMIC-CXR测试集中，取得了0.372 mAP的最先进结果，并在竞赛中获得第一名，突显了在医学图像分类中考虑多视图设置、类别不平衡和标签共同出现的重要性。