SMUGGLER:亚二次方多尺度统一生成门控语言编码器-表示
DEV Community
·
清华稀疏Attention,无需训练加速一切模型!
机器之心
·
解锁效率:LServe在长序列语言模型中的突破
DEV Community
·
Extending Context Length to One Million Tokens!
Blog on Qwen
·
第30天:Reformer:大规模模型的高效Transformer
DEV Community
·
长序列建模与注意力张量化:从序列到张量学习
BriefGPT - AI 论文速递
·