QASnowball:一个高质量问答数据生成的迭代自举框架
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该文介绍了一种利用AS2模型传递知识来训练GenQA模型的方法,通过对候选答案进行排序,使用排名最高的答案作为生成目标,并使用前k个排名最高的答案作为上下文进行训练。该方法在三个公共数据集和一个大型工业数据集上的评估中证明了优于AS2基线和使用监督数据训练的GenQA。
🎯
关键要点
-
提出了一种通过AS2模型传递知识来训练GenQA模型的方法。
-
该方法对候选答案进行排序,使用排名最高的答案作为生成目标。
-
使用前k个排名最高的答案作为上下文进行训练。
-
模型利用AS2模型的预测得分进行损失权重和条件输入/输出塑形。
-
在三个公共数据集和一个大型工业数据集上的评估中,该方法优于AS2基线和使用监督数据训练的GenQA。
➡️