Pandas-Profiling 现已支持 Apache Spark
原文英文,约1400词,阅读约需6分钟。发表于: 。Data profiling is the process of collecting statistics and summaries of data to assess its quality and other characteristics. It is an essential...
ydata-profiling是一个用于数据概要和分析的工具,它提供了数据的主要特征、单变量和多变量分析以及数据质量评估。它可以在Databricks中使用,并支持Spark DataFrames。