STAYKATE:结合代表性采样和基于检索的方法的混合上下文示例选择——以科学领域为案例研究
📝
内容提要
本研究解决了在科学信息提取中由训练数据不足和高昂标注成本引发的挑战,提出了一种新的混合选择方法STAYKATE。该方法结合了主动学习中的代表性采样原理和基于检索的方法,研究结果显示STAYKATE在性能上显著优于传统的监督方法和现有选择方法,尤其对其他方法难以处理的实体类型表现更佳。
➡️