基于CNN-Transformer模型的内窥镜和视频胶囊图像分类
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
内窥镜在胃肠道异常识别中起重要作用。深度学习特别是卷积神经网络在胃肠道内窥镜图像分析方面有优势。研究提出了基于多头注意力的特征融合机制,改进了轻量级模型。实验结果表明该模型在资源有限环境中运行的优点。
🎯
关键要点
- 内窥镜在识别胃肠道潜在异常方面的重要性。
- 深度学习,特别是卷积神经网络在胃肠道内窥镜图像分析中的优势。
- 现有模型主要关注性能提升,缺乏轻量级模型的开发。
- 研究采用基于知识蒸馏的学习框架,并引入多头注意力的特征融合机制。
- 在KVASIR-V2和Hyper-KVASIR数据集上进行评估,验证了模型的有效性。
- 提出的轻量级模型在资源有限环境中表现出色,仅有51.8k可训练参数。
➡️