RankAug: 文本分类的增强数据排名
原文中文,约200字,阅读约需1分钟。发表于: 。本研究提出了一种名为 RankAug 的文本排名方法,通过多样性的词汇和句法,检测和过滤出最具相似意义的顶级增强文本,从而改善生成数据过滤在自然语言理解任务中的性能,特别是意图和情感分类。通过对多个数据集进行实验,我们证明了过滤技术的精心选择可以显著提高少数派分类的准确性,提高了多达 35%。
本研究提出了一种名为RankAug的文本排名方法,通过多样性的词汇和句法,检测和过滤出最具相似意义的顶级增强文本,从而改善生成数据过滤在自然语言理解任务中的性能,特别是意图和情感分类。实验结果表明,过滤技术的精心选择可以显著提高少数派分类的准确性,提高了多达35%。