如何使用Python读写Parquet文件
原文英文,约1200词,阅读约需5分钟。发表于: 。Apache Parquet files are a popular columnar storage format used by data scientists and anyone using the Hadoop ecosystem. It was developed to be very efficient in terms of compression and...
Apache Parquet是一种流行的列式存储格式,使用pyarrow包可以方便地读写Parquet文件,读取部分列而不是整个文件,获取元数据和模式。