多项式组合激活函数:释放大型语言模型的动态性 原文中文,约300字,阅读约需1分钟。发表于:2024-11-06T00:00:00Z。 本研究解决了当前Transformer的激活函数局限性,提出了一种新的多项式组合激活函数(PolyCom),旨在优化Transformer的动态特性。通过理论分析和实证实验,我们发现PolyCom能够以更少的参数实现最佳逼近率,大幅提升大型语言模型的表现和收敛速度。 本研究提出了一种新的多项式组合激活函数(PolyCom),旨在克服Transformer激活函数的局限性,优化动态特性,从而提升大型语言模型的性能和收敛速度。 Transformer 函数 动态特性 多项式组合激活函数 大型语言模型 性能提升