python之value_counts()的具体使用
value_counts()
是一个用于统计某列中各个值的出现次数的函数。当配合参数 bins
使用时,它可以将数据分成指定的区间,然后统计每个区间内值的出现次数。
举个例子,假设我们有一个包含身高数据的DataFrame:
| 姓名 | 身高(cm) | |--------|---------| | 小明 | 175 | | 小红 | 160 | | 小刚 | 180 | | 小美 | 162 | | 小强 | 175 | | ... | ... |
我们可以使用 value_counts()
统计各个身高出现的次数:
height_counts = df['身高(cm)'].value_counts()
结果可能如下:
180 3
175 2
162 1
160 1
Name: 身高(cm), dtype: int64
这表示在数据中,身高为180cm的出现了3次,175cm出现了2次,162cm出现了1次,160cm出现了1次。
如果我们想将身高分成几个区间并统计每个区间内的人数,可以使用 bins
参数:
height_counts_bins = df['身高(cm)'].value_counts(bins=[150, 160, 170, 180, 190])
这将把身高分成以下区间:(150, 160], (160, 170], (170, 180], (180, 190],然后统计每个区间内的人数。
输出
假设在给定的数据中:
- 有3个人的身高在区间 (150, 160] 内,
- 有2个人的身高在区间 (160, 170] 内,
- 有1个人的身高在区间 (170, 180] 内,
- 没有人的身高在区间 (180, 190] 内,
那么 height_counts_bins
的输出可能会是类似于以下的结果:
(150.0, 160.0] 3
(160.0, 170.0] 2
(170.0, 180.0] 1
(180.0, 190.0] 0
Name: 身高(cm), dtype: int64
希望这个例子能帮到您理解 value_counts()
和 bins
的用法。
到此这篇关于python之value_counts()的具体使用的文章就介绍到这了,更多相关python value_counts()内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
python使用 multiprocessing 多进程处理批量数据的示例代码
这篇文章主要介绍了使用 multiprocessing 多进程处理批量数据的示例代码,本文通过示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2023-09-09
最新评论