BriefGPT - AI 论文速递 ·

提升基于图像的推荐系统可解释性的正 - 无标记学习

💡 原文中文，约1600字，阅读约需4分钟。

📝

内容提要

本研究提出了一种正无标记（PU）学习方法，通过正样本和未标记数据训练二元分类器，应用于文本分类。该方法在PubMed文摘的主题提取中表现优异，并通过强化学习和伪标记技术提升性能。实验结果表明，该方法在多个数据集上优于现有技术，解决了正偏差问题，具有广泛的应用前景，尤其在医学诊断领域。

🎯

❓

正无标记学习方法是通过正样本和未标记数据训练二元分类器的一种学习方法，主要用于文本分类。

该方法在PubMed文摘的细粒度主题提取中表现有效，显著提高了性能。

通过固定负类分布和结合负-未标注学习与未标注-未标注学习，可以解决正偏差问题。

实验结果表明，该方法在多个标准正未标化基准数据集上明显优于现有方法，尤其在标注数据稀缺时仍然有效。

该研究提出了三种自动化机器学习系统：GA-Auto-PU、BO-Auto-PU 和 EBO-Auto-PU。

正无标记学习在医学诊断领域具有广泛的应用前景，能够有效处理自然产生的数据类型。

🏷️