QKFormer: 使用 Q-K Attention 的层次化脉冲变压器

💡 原文中文,约2000字,阅读约需5分钟。
📝

内容提要

本文提出了一种新颖的脉冲自注意(SSA)和脉冲变换器(Spikformer),通过自监督学习训练,实验证明其在ImageNet上的分类准确性超过80%。Spikformer结合了脉冲神经网络的生物特性和自注意力机制,展示了在多个数据集上的优越性能。新架构通过引入线性变换加速计算,提高了训练和推断速度,并减少了内存使用。

🎯

关键要点

  • 本文提出了一种新颖的脉冲自注意(SSA)和脉冲变换器(Spikformer),结合了脉冲神经网络的生物特性和自注意力机制。
  • 通过自监督学习训练,Spikformer在ImageNet上的分类准确性超过80%。
  • Spikformer引入了脉冲自注意力(SSA)模块,利用脉冲形式的查询、键和值来捕获稀疏视觉特征。
  • 新架构通过线性变换加速计算,提高了训练和推断速度,并减少了内存使用。
  • 与具有SSA的Spikformer相比,具有线性变换的Spikformer在神经形态学数据集上实现了更高的Top-1准确率,并且在静态数据集上实现了可比较的Top-1准确率。
  • 具有线性变换的Spikformer实现了约29%至51%的训练速度提升,61%至70%的推断速度提升,减少了4%至26%的内存使用量。

延伸问答

Spikformer的主要特点是什么?

Spikformer结合了脉冲神经网络的生物特性和自注意力机制,能够捕获稀疏视觉特征,并在多个数据集上表现出优越性能。

Spikformer在ImageNet上的分类准确性是多少?

Spikformer在ImageNet上的分类准确性超过80%。

Spikformer如何提高训练和推断速度?

Spikformer通过引入线性变换加速计算,实现了约29%至51%的训练速度提升和61%至70%的推断速度提升。

Spikformer与传统神经网络相比有什么优势?

Spikformer在静态数据集和神经形态数据集上均优于其人工神经网络对应物,且在多个数据集上展现出最先进的性能。

Spikformer的内存使用情况如何?

Spikformer在使用线性变换时减少了4%至26%的内存使用量。

脉冲自注意(SSA)模块的作用是什么?

脉冲自注意(SSA)模块利用脉冲形式的查询、键和值来捕获稀疏视觉特征,消除了softmax的需求。

➡️

继续阅读