QKFormer: 使用 Q-K Attention 的层次化脉冲变压器
💡
原文中文,约2000字,阅读约需5分钟。
📝
内容提要
本文提出了一种新颖的脉冲自注意(SSA)和脉冲变换器(Spikformer),通过自监督学习训练,实验证明其在ImageNet上的分类准确性超过80%。Spikformer结合了脉冲神经网络的生物特性和自注意力机制,展示了在多个数据集上的优越性能。新架构通过引入线性变换加速计算,提高了训练和推断速度,并减少了内存使用。
🎯
关键要点
- 本文提出了一种新颖的脉冲自注意(SSA)和脉冲变换器(Spikformer),结合了脉冲神经网络的生物特性和自注意力机制。
- 通过自监督学习训练,Spikformer在ImageNet上的分类准确性超过80%。
- Spikformer引入了脉冲自注意力(SSA)模块,利用脉冲形式的查询、键和值来捕获稀疏视觉特征。
- 新架构通过线性变换加速计算,提高了训练和推断速度,并减少了内存使用。
- 与具有SSA的Spikformer相比,具有线性变换的Spikformer在神经形态学数据集上实现了更高的Top-1准确率,并且在静态数据集上实现了可比较的Top-1准确率。
- 具有线性变换的Spikformer实现了约29%至51%的训练速度提升,61%至70%的推断速度提升,减少了4%至26%的内存使用量。
❓
延伸问答
Spikformer的主要特点是什么?
Spikformer结合了脉冲神经网络的生物特性和自注意力机制,能够捕获稀疏视觉特征,并在多个数据集上表现出优越性能。
Spikformer在ImageNet上的分类准确性是多少?
Spikformer在ImageNet上的分类准确性超过80%。
Spikformer如何提高训练和推断速度?
Spikformer通过引入线性变换加速计算,实现了约29%至51%的训练速度提升和61%至70%的推断速度提升。
Spikformer与传统神经网络相比有什么优势?
Spikformer在静态数据集和神经形态数据集上均优于其人工神经网络对应物,且在多个数据集上展现出最先进的性能。
Spikformer的内存使用情况如何?
Spikformer在使用线性变换时减少了4%至26%的内存使用量。
脉冲自注意(SSA)模块的作用是什么?
脉冲自注意(SSA)模块利用脉冲形式的查询、键和值来捕获稀疏视觉特征,消除了softmax的需求。
➡️