Pandas实现(pivot_table函数)数据透视表方式
更新时间:2024年09月10日 16:26:21 作者:呀~吼
pandas的pivot_table()函数非常强大,主要用于创建数据透视表,重要参数包括index、values、columns和aggfunc,index用于设置行索引,类似于SQL中的group by,values用于进行聚合计算的数据选择,columns参数可设置列层次,非必须
Pandas (pivot_table函数)数据透视表
使用pandas中的pivot_table()实现数据透视表。
语法格式如下:
pd.pivot_table(data,values=None,index=None, columns=None,aggfunc='mean',fill_value=None,margins=False,dropna=True, margins_name='All')
pd.pivot_table()有四个最重要的参数index、values、columns、aggfunc。
四个最重要参数解析
index:
- 相当于SQL里的group by用于分组的字段,相当于行索引。
- index也是层次字段,要通过透视表获取什么信息就按照相应的顺序设置字段。
pd.pivot_table(data,index=['列名1','列名2'])
values:
- 相当于SQL里对列进行聚合计算
- 对需要的计算数据进行筛选
pd.pivot_table(data,index=['列名1','列名2'],values=['计算列名1','计算列名2','计算列名3'])
columns:
- columns类似index可以设置列层次字段
- 它不是一个必要参数,作为一种分割数据的可选方式
pd.pivot_table(data,index=['列名1','列名2'], values=['计算列名1','计算列名2','计算列名3'],columns=['列名3'])
aggfunc:
- aggfunc参数可以设置对数据聚合时进行的函数操作。
- 对于aggfunc参数,操作的是values后面的值,而不是columns后面的值。
- 分别对values参数中的每一列都进行求和与求平均值。
pd.pivot_table(data,index=['列名1','列名2'], values=['计算列名1','计算列名2','计算列名3'],aggfunc=[np.sum,np.mean])
fill_value:当数据为空时,填充的指定值。fill_value=0
注意:
- aggfunc也可以使用dict类型,这样可以指定values中每一列的聚合函数。
- 如果dict中的内容与values不匹配时,以dict中为准。
table=pd.pivot_table(data,index=['列名1','列名2'],columns=['列名3'], values=['计算列名1','计算列名2','计算列名3'], aggfunc={'计算列名1':np.mean,'计算列名2':[min, max, np.mean]},fill_value=0)
结果就是’计算列名2’求min,max和mean,'计算列名1’求mean,而’计算列名3’没有显示。
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
Python使用cn2an实现中文数字与阿拉伯数字的相互转换
这篇文章主要介绍了Python使用cn2an实现中文数字与阿拉伯数字的相互转换,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2021-03-03Python中enumerate()函数详细分析(附多个Demo)
Python的enumerate()函数是一个内置函数,主要用于在遍历循环中获取每个元素的索引以及对应的值,这篇文章主要介绍了Python中enumerate()函数的相关资料,需要的朋友可以参考下2024-10-10Pandas数据结构详细说明及如何创建Series,DataFrame对象方法
本篇文章中,我们主要侧重于介绍Pandas数据结构本身的特性,以及如何创建一个Series或者DataFrame数据对象,并填入一些数据2021-10-10
最新评论