SPM: 美团搜索中结构化预训练和匹配架构的相关性建模
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一种利用类平衡数据集和多任务预训练的多语言模型,以获得更一般化的表示。作者采用多种方法提高模型的泛化能力和鲁棒性,并使用多粒度语义单元增强模型的表示能力。该方法在三个任务中排名前八。
🎯
关键要点
- 提出了一种有效的多语言模型,利用类平衡数据集和多任务预训练。
- 模型通过mlm任务、分类任务和对比学习任务进行训练。
- 在微调阶段采用自信学习、EMA、FGM和R-Drop等方法提高模型的泛化能力和鲁棒性。
- 使用多粒度语义单元增强模型的表示能力。
- 该方法在三个任务中排名前八。
➡️