该论文介绍了一种基于树的可变系数模型,使用循环梯度提升机对系数函数进行建模。该模型实现了基于维度的早停和特征重要性得分,降低了过拟合风险并揭示了维度之间的模型复杂性差异。在评估中,该模型在样本外损失方面与神经网络可变系数模型相当。
该文介绍了一种高效省时的特征重要性得分定义方法,可用于隔离森林的全局和局部层面,并提出了一种无监督异常检测中的特征选择过程。作者在多个数据集上进行了评估和比较。
完成下面两步后,将自动完成登录并继续当前操作。