基于Transformer架构的基础模型存在内容导向推理的弱点,通过改进结构状态空间模型(SSMs)参数成为输入的函数,将选择性SSMs集成到简化的神经网络架构中,提出了快速推断速度和线性扩展的模型Mamba,在多个模态上实现了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。