HySparK:大规模医学图像的混合稀疏掩蔽预训练
原文中文,约400字,阅读约需1分钟。发表于: 。本研究针对基于混合架构的CNN和Transformer的端到端预训练方法不足的问题,提出了一种新的生成性预训练策略HySparK,结合了掩蔽图像建模,旨在提升医学图像的学习效果。研究表明,HySparK在监督下游任务中展现出强大的迁移能力,预示着其在医学影像分析方面的广阔前景。
本文介绍了一种创新的自监督学习方法,通过局部遮罩图像建模和渐进层冻结相结合,提高了Vision Transformers(ViTs)中初始层训练的效率和速度。该方法采用了多尺度重构过程,实现了高效学习和跨尺度的语义理解。实验结果表明,该方法在准确性最小影响的情况下,大幅减少了训练时间。该方法在计算资源和时间至关重要的场景中具有潜力,标志着计算机视觉领域自监督学习的进步。