本文介绍了如何使用Pingouin库进行严格的探索性数据分析(EDA),验证数据的统计特性。通过分析葡萄酒数据集,检查了单变量和多变量的正态性、同方差性、球形性及多重共线性。结果显示数据不符合正态分布,存在异方差性和相关性,这些问题需在后续建模中考虑。使用Pingouin可以优化数据预处理和模型选择。
我们提出了一种基于Kac-Bernstein的特征的简单多元正态检验方法,通过利用现有的数据样本和差异的统计独立性检验来进行。实证研究结果显示,对于高维数据,该方法可能比其他替代方法更有效。
完成下面两步后,将自动完成登录并继续当前操作。