基于 MMD 的分布式随机森林变量重要性

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种用于分布随机森林的变量重要性算法,能够高效地选择变量并提供准确估计。该算法在真实数据和模拟数据上表现出高的经验性能。

🎯

关键要点

  • 分布随机森林是一种灵活的基于森林的方法,用于估计多变量输出的全条件分布。
  • 本文介绍了一种用于分布随机森林的变量重要性算法,基于删除与重学习原则和最大均值差异距离。
  • 该算法的重要性指标在真实数据和模拟数据上表现出高的经验性能,并胜过竞争对手。
  • 算法通过递归特征消除高效选择变量,提供准确估计的小的变量集用于建立条件输出分布。
➡️

继续阅读