基于张量分解的脉冲神经网络注意力模块
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
该论文介绍了一种名为 Spikformer 的新型神经网络架构,将自注意力能力和脉冲神经网络相结合,使用脉冲形式的查询、键和值来混合稀疏视觉特征,展示了强大的性能和效率。该论文还证明了 Spikformer 架构可以通过将脉冲自注意力替换为非参数化的线性变换来加速,并在神经形态学数据集上实现了更高的准确率和更快的训练速度。
🎯
关键要点
-
Spikformer 是一种结合自注意力能力和脉冲神经网络的新型架构。
-
引入脉冲自注意力模块,使用脉冲形式的查询、键和值来混合稀疏视觉特征。
-
Spikformer 在许多数据集上表现出最先进的性能。
-
通过将脉冲自注意力替换为非参数化的线性变换来加速 Spikformer 架构。
-
使用傅里叶和小波变换将二次时间复杂度降低为对数线性时间复杂度。
-
在神经形态学和静态数据集上进行广泛实验,结果显示具有 LT 的 Spikformer 在准确率和速度上均优于具有 SSA 的版本。
-
具有 LT 的 Spikformer 实现了约 29% 至 51% 的训练速度提升和 61% 至 70% 的推断速度提升。
-
使用 LT 的 Spikformer 减少了 4% 至 26% 的内存使用量。
➡️