本文提出了一种名为FMLA的灵活的多头线性注意力方法,通过与可变形卷积块和在线知识蒸馏进行分层交互来提高局部感知能力。同时,还提出了一种简单但有效的掩码机制,以减少时间序列中的噪声影响并降低FMLA的冗余。实验结果表明,该算法在top-1准确性方面具有可比性,并且在浮点运算每秒和参数数量方面比三种基于Transformer的模型更加高效。
完成下面两步后,将自动完成登录并继续当前操作。