SPM: 美团搜索中结构化预训练和匹配架构的相关性建模

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了一种利用类平衡数据集和多任务预训练的多语言模型,以获得更一般化的表示。作者采用多种方法提高模型的泛化能力和鲁棒性,并使用多粒度语义单元增强模型的表示能力。该方法在三个任务中排名前八。

🎯

关键要点

  • 提出了一种有效的多语言模型,利用类平衡数据集和多任务预训练。
  • 模型通过mlm任务、分类任务和对比学习任务进行训练。
  • 在微调阶段采用自信学习、EMA、FGM和R-Drop等方法提高模型的泛化能力和鲁棒性。
  • 使用多粒度语义单元增强模型的表示能力。
  • 该方法在三个任务中排名前八。
➡️

继续阅读