随机森林中超参数对变量选择的影响
原文约600字/词,阅读约需2分钟。发表于: 。随机森林 (RF) 在高维物质研究中的预测建模和变量选择方面具有很好的适用性。超参数在 RF 算法对预测性能和变量重要性估计的影响已被研究,然而,超参数对基于 RF 的变量选择的影响尚不清楚。本文使用理论分布和实验基因表达数据进行两个模拟研究,评估了 Vita 和 Boruta...
本文研究了随机森林在高维物质研究中的预测建模和变量选择方面的适用性。通过两个模拟研究,评估了Vita和Boruta变量选择程序的效果。结果表明,超参数的适当设置取决于数据中的相关结构,超参数的默认值并非总是适合于识别重要变量。因此,适当的取值因研究的目标是否在于优化预测性能或变量选择而异。