小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Python Pandas弃用NumPy,采用更快的PyArrow

Pandas 3.0即将发布,采用PyArrow替代NumPy,显著提升数据加载和读取速度,读取速度提高10倍。用户可无缝过渡,API保持不变。

Python Pandas弃用NumPy,采用更快的PyArrow

The New Stack
The New Stack · 2025-05-27T14:00:37Z

本文介绍了如何使用PyArrow进行数据分析。PyArrow是一个高效的内存数据处理库,支持列式存储。文章详细讲解了PyArrow的核心数据结构,如Table、RecordBatch、Array等,并展示了如何读取和写入Parquet、JSON、CSV和Feather文件。还介绍了基本的数据操作,如过滤、连接和聚合。最后,文章介绍了通过PyArrow连接到Dremio进行高效数据传输的Apache Arrow Flight,适用于大数据分析。

使用 PyArrow 在 Python 中进行数据分析入门

DEV Community
DEV Community · 2024-10-15T15:27:53Z

Apache Parquet是一种流行的列式存储格式,使用pyarrow包可以轻松读写Parquet文件。可以转换DataFrame为Parquet文件,并选择只读取部分列。还可以从Parquet文件获取元数据和架构信息。pyarrow使得处理Parquet文件变得简单。

Python中读写Parquet文件的方法

极道
极道 · 2024-05-13T02:17:00Z
如何使用Python读写Parquet文件

Apache Parquet是一种流行的列式存储格式,使用pyarrow包可以方便地读写Parquet文件,读取部分列而不是整个文件,获取元数据和模式。

如何使用Python读写Parquet文件

Mouse Vs Python
Mouse Vs Python · 2024-05-06T13:57:46Z

绿盟科技CERT监测发现Apache Arrow发布安全通告,修复了PyArrow库中的一个任意代码执行漏洞(CVE-2023-47248)。攻击者可通过构造恶意数据包,在目标系统上实现任意代码执行。受影响版本为0.14.0 <= Apache Arrow PyArrow <= 14.0.0,官方已发布新版本,请尽快升级。若无法升级,可使用官方提供的“pyarrow-hotfix”软件包禁用漏洞。

Apache Arrow PyArrow任意代码执行漏洞(CVE-2023-47248)通告

绿盟科技技术博客
绿盟科技技术博客 · 2023-11-14T08:28:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码