EELBERT:通过动态嵌入实现微小模型

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

EELBERT是一种基于transformer模型的压缩方法,成功地显著减小了模型的大小,并在GLUE基准测试中证明了EELBERT与传统BERT模型之间仅有微小的回归差异。

🎯

关键要点

  • EELBERT是一种基于transformer模型的压缩方法。

  • EELBERT通过动态嵌入计算在输入嵌入层中实现对下游任务准确性的最小影响。

  • EELBERT显著减小了模型的大小。

  • 在GLUE基准测试中,EELBERT与传统BERT模型之间仅有微小的回归差异。

  • UNO-EELBERT是最小的模型,大小为14MB,GLUE得分仅相对于完全训练的BERT-tiny低4%。

➡️

继续阅读