HR 微分学:使用四元数代数实现信息处理
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文提出了一系列轻量级和内存高效的神经网络模型,利用四元数代数和超复数空间进行计算,减少了模型参数的大小达到 75%。作者在多项 NLP 任务上进行了实验,证明了所提出的模型的优越性。
🎯
关键要点
- 提出了一系列轻量级和内存高效的神经网络模型。
- 利用四元数代数和超复数空间进行计算。
- 模型参数的大小减少了 75%。
- 提出了四元数变体模型和新的架构,如四元数注意力模型和四元数变换器模型。
- 在多项 NLP 任务上进行了广泛的实验,证明了模型的优越性。
➡️