相关性测试用于衡量两个变量之间的关联强度,主要分为参数相关性(如皮尔逊相关系数)和非参数相关性(如肯德尔和斯皮尔曼)。皮尔逊相关系数的范围为-1到1,0表示无相关性。可以使用Python的scipy库计算皮尔逊相关性,但需注意数据可视化和异常值的影响。
本文介绍了数据预处理中的数据规约的几种方法:主成分分析、线性判别分析、皮尔逊相关系数、卡方检验和数据抽样。这些方法在特征工程中常用于特征选择和数据规约。
完成下面两步后,将自动完成登录并继续当前操作。