线性循环神经网络中推进常规语言推理

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文章介绍了一种新的 LRNN 模型,具有块对角线和输入相关的转移矩阵,能够在正则语言任务中进行长度外推。该模型在求和、偶数对和模运算等任务中表现出色,具有快速的并行训练和恒定的推断成本。

🎯

关键要点

  • 文章介绍了一种新的线性递归神经网络(LRNN)模型。
  • 该模型具有块对角线和输入相关的转移矩阵。
  • LRNN在正则语言任务中表现出色,能够进行长度外推。
  • 模型在求和、偶数对和模运算等任务中表现优异。
  • LRNN提供快速的并行训练和恒定的推断成本。
  • 研究表明LRNN在自然语言建模和长期建模方面与Transformer相媲美。
➡️

继续阅读