本研究提出了一种AL4RAG方法,通过活跃学习从对话记录中选择样本,以提升检索增强生成(RAG)在大型语言模型中的性能。该方法显著改善了模型效果,展示了活跃学习的潜力。
本文探讨了活跃学习技术在文本分类中的应用,强调选择合适的文本表示、分类器和评估指标的重要性。研究结合自监督预训练和Balanced Selection算法,解决类不平衡问题,提升分类性能。此外,提出了多样性原则的查询策略和基于聚类的主动学习框架,以降低注释成本并提高学习效果。
完成下面两步后,将自动完成登录并继续当前操作。