ITBOB'S BLOG ·

Python 数据分析三剑客之 Pandas（六）：GroupBy 数据分裂/应用/合并

💡 原文中文，约16900字，阅读约需41分钟。

📝

内容提要

本文介绍了Pandas库中的GroupBy机制，强调数据分裂、应用和合并的过程。通过groupby()方法，可以对数据进行分组并应用聚合函数，如mean和count。还讨论了自定义分组和对不同列应用不同函数的技巧，以灵活满足分析需求。

🎯

关键要点

Pandas的GroupBy机制包括数据分裂、应用和合并的过程。
使用groupby()方法可以对数据进行分组并应用聚合函数，如mean和count。
GroupBy对象可以通过Series.groupby和DataFrame.groupby创建，支持多种参数设置。
可以根据类型、列或自定义键进行分组，支持多种分组方式。
GroupBy对象支持迭代，可以生成分组名和对应的数据块。
聚合函数包括count、mean、min、max等，可以对分组后的数据进行计算。
可以自定义聚合函数，并通过GroupBy.agg()方法应用于分组数据。
使用字典可以对不同列应用不同的聚合函数，灵活满足分析需求。

❓

延伸问答

Pandas中的GroupBy机制是什么？

GroupBy机制包括数据分裂、应用和合并的过程，通常用于对数据集进行分组并计算统计信息。

如何使用groupby()方法进行数据分组？

可以通过Series.groupby或DataFrame.groupby方法，传入分组依据的参数进行数据分组。

在GroupBy中可以使用哪些聚合函数？

常用的聚合函数包括count、mean、min、max等，可以对分组后的数据进行计算。

如何对不同列应用不同的聚合函数？

可以使用字典将不同的聚合函数映射到不同的列，例如{'data1':'mean', 'data2':'sum'}。

GroupBy对象支持哪些分组方式？

GroupBy对象支持按类型、列或自定义键进行分组，灵活满足分析需求。

如何自定义聚合函数并应用于GroupBy？

可以定义一个自定义函数，并通过GroupBy.agg()方法将其应用于分组数据。

🏷️

标签

GroupBy Pandas python 数据分析数据分组聚合函数自定义分组

➡️

继续阅读

WAIC重磅成果｜仪电智算云在国家人工智能应用中试基地建设中展现全栈服务能力
AI-DLC 在数据工程中的实践：从分层建模到数据质量的全流程协作
本文将介绍 AI-DLC（AI-Driven Development Life Cycle）——亚马逊云科技于 2025 年提出的一套开发方法论——在数据...
UKB五万人数据：过滤咖啡与延缓生物衰老有关，而速溶咖啡则恰恰相反
喝掉三亿杯速溶咖啡的人，你们的生物年龄正在偷偷加速，这事儿你们敢信吗？最新UK Biobank追踪近五万人的数据显示，滤泡咖啡和速溶咖啡在生物衰老这件事...
AI厂商正用你的使用数据偷走核心Context知识：逆向悖论防御指南
2026年，全球企业因AI使用间接泄露的专有知识总估值超4000亿美元，你每纠正一次模型错误就是在给厂商白送下季度对手用来击败你的弹药？诺贝尔经济学奖得...
Building Agentic Workflows in Python with LangGraph
In this article, you will learn how to build a complete agentic workflow in P...
Run the Mythos Enhanced Coding Model Locally with llama.cpp and Pi
Run Qwythos-9B-Claude-Mythos-5-1M locally with llama.cpp, connect it to Pi co...