机器学习中高基数分类变量的高效表示
📝
内容提要
本研究解决了高基数分类变量在机器学习中所带来的计算效率和模型可解释性问题。通过提出包括均值编码、低秩编码和多项式逻辑回归编码在内的新编码技术,研究展示了这些方法如何利用充分表示生成紧凑且信息丰富的分类数据嵌入。实证结果表明,与基线方法相比,所提出的技术在模型性能和计算效率方面均有显著提升,具有广泛的应用潜力。
🏷️
标签
➡️