NextLevelBERT:探索使用高级表示进行长文档的遮蔽语言建模
原文中文,约300字,阅读约需1分钟。发表于: 。NextLevelBERT 是一种掩码语言模型,通过对高级语义表示进行预测,可以有效处理长文档,并在语义文本相似性、长文档分类和多项选择问答三个任务类型上取得较好效果。
本文介绍了NarrowBERT,一种修改的transformer编码器,通过仅在屏蔽令牌上操作来增加掩码语言模型预训练的吞吐量。NarrowBERT在推理时间的吞吐量提高了3.5倍,性能降低最小,并且在多个任务上与标准BERT相当。