马里兰大学提出了一种新型语言模型架构,采用深度循环方法显著提升推理效率。该模型仅需3.5亿参数,性能可与50亿参数模型媲美,尤其在复杂推理任务中表现突出。研究表明,循环机制有效处理复杂计算,降低内存需求,无需专门训练数据,具有广泛应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。