本研究提出了一种新方法——门控增量规则,旨在提升线性变换器在检索和长文本任务中的表现。Gated DeltaNet架构在多个基准测试中超越了现有模型,展现出更高的训练效率和任务表现。
完成下面两步后,将自动完成登录并继续当前操作。