本研究提出了一种层次稀疏注意力(HSA)机制,解决了递归神经网络(RNN)在随机访问历史上下文方面的局限性。结合HSA与Mamba形成的RAMba在6400万上下文中实现了完美的密码检索准确率,展示了其在长上下文建模中的潜力。
完成下面两步后,将自动完成登录并继续当前操作。