“对角+低秩”三角阵的高效求逆方法

📝

内容提要

从文章《线性注意力简史:从模仿、创新到反哺》我们可以发现,DeltaNet及其后的线性Attention模型,基本上都关联到了逆矩阵$(\boldsymbol{I} + \boldsymbol{...

➡️

继续阅读