基于Pair-wise和CrossEncoder训练单塔模型
原文中文,约43900字,阅读约需105分钟。发表于: 。基于RocketQA的CrossEncoder(交叉编码器)训练的单塔模型,该模型用于搜索的排序阶段,对召回的结果进行重新排序的作用。
本文介绍了基于ERNIE-Gram模型训练的排序模型和基于RocketQA的CrossEncoder训练的单塔模型。排序模型使用双塔模型和margin_ranking_loss进行训练,评估指标为AUC。训练环境依赖于Python和PaddlePaddle等库。代码结构包括部署、环境依赖、代码结构、数据介绍等部分。基于RocketQA的CrossEncoder训练的单塔模型用于搜索的排序阶段,对召回的结果进行重新排序。CrossEncoder模型与Pairwise模型的区别在于输入方式、训练方式、处理效率和应用场景等。