QEAN:面向视觉舞蹈生成的四元数增强注意力网络

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一系列轻量级和内存高效的神经网络模型,利用四元数代数和超复数空间进行计算,减少了模型参数的大小达到75%。作者在多项NLP任务上进行了实验,证明了所提出的模型的优越性。

🎯

关键要点

  • 提出了一系列轻量级和内存高效的神经网络模型。
  • 利用四元数代数和超复数空间进行计算。
  • 模型参数的大小减少了75%,不影响性能。
  • 提出了四元数变体模型和新的架构,如四元数注意力模型和四元数变换器模型。
  • 在多项NLP任务上进行了广泛的实验,证明了模型的优越性。
➡️

继续阅读