本研究通过引入基于transformer的CheXFusion融合模块,结合多视图图像处理,利用自注意力和交叉注意力机制,高效聚合多视图特征并考虑标签的共现作用。同时,探索数据平衡和自训练方法以提高模型性能。在MIMIC-CXR测试集中,取得了0.372 mAP的最先进结果,并在竞赛中获得第一名,突显了在医学图像分类中考虑多视图设置、类别不平衡和标签共同出现的重要性。
完成下面两步后,将自动完成登录并继续当前操作。