本研究提出Mamba-Shedder方法,解决了变换器架构在序列建模中的效率问题。通过去除SSR模型的选定组件,实现了模型压缩和计算开销减少,推理速度提升最高达1.4倍,且对模型性能影响最小。
完成下面两步后,将自动完成登录并继续当前操作。