DADEE:早期退出预训练语言模型中的无监督领域适应
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文研究了无监督领域适应在下游任务中的应用,提出了UDALM微调方法,结合分类和掩码语言模型损失。实验表明,混合损失训练模型的性能与目标数据量相关,可作为训练停止的标准。在Amazon评论数据集上,准确率达到91.74%,超过现有技术1.11%。
🎯
关键要点
- 研究无监督领域适应在下游任务中的应用。
- 提出UDALM微调方法,结合分类和掩码语言模型损失。
- 混合损失训练模型的性能与目标数据量相关,可作为训练停止的标准。
- 在Amazon评论数据集上,准确率达到91.74%,超过现有技术1.11%。
- 讨论A距离和目标误差之间的关系,探索域对抗训练方法的局限性。
➡️