本研究提出了一种正无标记(PU)学习方法,通过正样本和未标记数据训练二元分类器,应用于文本分类。该方法在PubMed文摘的主题提取中表现优异,并通过强化学习和伪标记技术提升性能。实验结果表明,该方法在多个数据集上优于现有技术,解决了正偏差问题,具有广泛的应用前景,尤其在医学诊断领域。
完成下面两步后,将自动完成登录并继续当前操作。