CTA-Net: A CNN-Transformer Aggregation Network for Enhanced Multi-Scale Feature Extraction
原文英文,约100词,阅读约需1分钟。发表于: 。本研究针对卷积神经网络(CNN)和视觉变换器(ViT)在特征提取中的组合效率低下问题,提出了CNN-Transformer聚合网络(CTA-Net)。通过引入轻量级多尺度特征融合多头自注意力模块(LMF-MHSA)及反向重构CNN变体(RRCV),CTA-Net在小规模数据集上的实验显示了卓越的性能和更低的参数需求,具备高效轻量的视觉任务处理能力。
本研究提出了CTA-Net,通过结合轻量级多尺度特征融合模块和反向重构CNN变体,解决了CNN和ViT在特征提取中的低效问题,在小数据集上表现优异,适合高效轻量的视觉任务。