本研究提出了几种具有线性复杂度的新替代方案,用于解决自监督学习中的多头自注意力计算和内存消耗过大的问题。实验结果显示,这些替代方案在保持竞争性性能的同时,平均减少了20%至60%的内存消耗,并在处理输入序列时速度提升了7%至65%。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: