pandas
聚合
groupby
看过来
《pandas 教程》 持续更新中,可作为 pandas 入门进阶课程、pandas 中文手册、用法大全,配有案例讲解和速查手册。提供建议、纠错、催更等加作者微信: gairuo123(备注:pandas教程)和关注公众号「盖若」ID: gairuo。查看更新日志。作者开办 Python 数据分析培训,详情 Python 数据分析培训。
![]() |
本教程作者所著新书《Python之光:Python编程入门与实战》(ISBN:9787111729891)已由机械工业出版社出版上市,各大电商平台有售,欢迎:查看详情并关注购买。 |
![]() |
本教程作者所著新书《深入浅出Pandas:利用Python进行数据处理与分析》(ISBN:9787111685456)已由机械工业出版社出版上市,各大电商平台有售,欢迎:查看详情并关注购买。 |
聚合分组非常常见,我们的数据是扁平化的,没有任何分组信息。比如你一周会多次去一家便利店,每次会产生一条购买记录,那么便利店想统计每个人这周的购买情况,就需要以人来进行分组,然后所有的金额相加,就得出每个人的购买额。
SQL 这样做分组和聚合:
SELECT Column1, Column2, mean(Column3), sum(Column4)
FROM SomeTable
GROUP BY Column1, Column2
上边的 SQL 是我们提取数据最常用的方法,接下来,我们将学习如何利用 Pandas 进行分组统计。
Pandas 也是按照 SQL 的思路,对数据进行非常灵活的分组,分组后会产生一个分组对象,接下来的操作就是就是对这个分组对象的操作。
针对分组对象,Pandas 操作了多个方面,如 agg 聚合、apply 自定义函数、迭代等,方便大家实现多种多样的聚合需求。
执行完分组统计计算后,再将数据拼成一个最终的数据返回给我们。
在接下来的教程中,让多体会一下 SQL 之外,Pandas 带给我们的惊喜!
无「盖若」授权,请勿以任何形式转载,公众号:gairuo
Copyright © 2019 - 2023
Gairuo.com All Rights Reserved v7.6.1.0919
京公网安备11010502033395号
京ICP备15019454号-4