小红花·文摘 - 小红花技术领袖俱乐部

本研究探讨了线性注意力与Softmax注意力之间的性能差距，提出理论分析，指出提升线性注意力的注入性和局部建模能力可以降低计算复杂度，从而超越Softmax注意力。

Bridging the Gap: Rethinking Softmax and Linear Attention

BriefGPT - AI 论文速递 ·

CvT：微软提出结合CNN的ViT架构 | 2021 arxiv - 晓飞的算法工程笔记

CvT：微软提出结合CNN的ViT架构 | 2021 arxiv - 晓飞的算法工程笔记

晓飞的算法工程笔记 ·