Swin-Tempo: 使用 Swin Transformer 增强的 UNet 在 CT 扫描作为视频序列中具有时间感知的肺结节检测
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一种创新模型,结合了卷积神经网络和视觉变换器的优势,将每个 3D CT 图像视为视频,每个切片视为帧,将肺结节视为对象,使其能够进行时间序列应用,以克服模型训练过程中的硬件限制,实现对 2D 数据的高效处理,并利用 3D 图像上下文进行准确识别。通过对公开可用的 Lung Nodule Analysis 2016 数据集应用 10...
该研究提出了一种创新的模型,将3D CT图像视为视频,每个切片视为帧,以实现对2D数据的高效处理,并利用3D图像上下文进行准确识别。该模型在肺结节识别领域表现显著,平均敏感性指标达到了97.84%的准确度以及96.0%的竞赛性能指标(CPM),并且参数较少。