隐私感知主动学习中的最大信息增益策略研究
原文中文,约500字,阅读约需2分钟。发表于: 。通过使用信息增益最大化启发式方法,我们开发了一种增强的主动学习方法,并在一个真实环境中对其有效性进行了评估,该环境中由于隐私问题,只能由人类分析员对电子邮件的编辑版本进行标记。在两个案例研究中,我们发现对模型性能进行最佳评估的方法是由一位高技能的分析员提供标签,并使用置信度评分来估计分析员的标签不确定性,并根据预期信息增益的优先级对实例进行标记。我们发现,信息增益最大化启发式方法相对于现有的...
研究人员通过信息增益最大化启发式方法开发了一种增强的主动学习方法,并在真实环境中评估了其有效性。研究发现,高技能的分析员提供标签,并使用置信度评分来估计分析员的标签不确定性,并根据预期信息增益的优先级对实例进行标记是最佳的评估方法。研究还建议在实施主动学习之前对分析员进行筛选和培训,并在早期阶段使用基于专家置信度的信息增益最大化采样方法。