线性循环神经网络中推进常规语言推理
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文章介绍了一种新的 LRNN 模型,具有块对角线和输入相关的转移矩阵,能够在正则语言任务中进行长度外推。该模型在求和、偶数对和模运算等任务中表现出色,具有快速的并行训练和恒定的推断成本。
🎯
关键要点
- 文章介绍了一种新的线性递归神经网络(LRNN)模型。
- 该模型具有块对角线和输入相关的转移矩阵。
- LRNN在正则语言任务中表现出色,能够进行长度外推。
- 模型在求和、偶数对和模运算等任务中表现优异。
- LRNN提供快速的并行训练和恒定的推断成本。
- 研究表明LRNN在自然语言建模和长期建模方面与Transformer相媲美。
➡️