更具表现力的负权重注意力机制
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新型的Cog Attention注意力机制,允许负权重,从而提升表达能力。通过动态QK内积,Cog Attention能够灵活处理令牌操作,增强模型的鲁棒性。实验结果表明,其性能显著优于传统的softmax注意力模块。
🎯
关键要点
- 本研究提出了一种新型的Cog Attention注意力机制。
- Cog Attention允许注意力权重为负,从而提高表达能力。
- 通过动态的QK内积,Cog Attention能够灵活处理令牌的删除、复制与保留。
- Cog Attention增强了模型在表示崩溃情境下的鲁棒性。
- 实验结果表明,Cog Attention的性能显著优于传统的softmax注意力模块。
🏷️
标签
➡️