pandas 实现 in 和 not in 的用法及使用心得
pandas in 和 not in 的用法
经常在处理数据中从一个总数据中清洗出数据, 但是有时候需要把没有处理的数据也统计出来.
这时候就需要使用:
pandas.DataFrame.isin
DataFrame中的每个元素是否都包含在值中
例子:
如何实现SQL的等价物IN和NOT IN? 我有一个包含所需值的列表。下面是一个场景: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries]
之前的做法是这样:
df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in = df.merge(countries,how='left',on='countries') not_in = not_in[pd.isnull(not_in['matched'])]
但上面这样做觉得很不好, 也翻了文档才找到比较好解决方式.
# IN something.isin(somewhere) # NOT IN ~something.isin(somewhere)
例子:
>>> df countries 0 US 1 UK 2 Germany 3 China >>> countries ['UK', 'China'] >>> df.countries.isin(countries) 0 False 1 True 2 False 3 True Name: countries, dtype: bool >>> df[df.countries.isin(countries)] countries 1 UK 3 China >>> df[~df.countries.isin(countries)] countries 0 US 2 Germany
ps:pandas实现in和 not in
pandas中经常会需要对某列做一些筛选,比如筛选某列里的不包含某些值的行,类似sql里的in和not in功能,那么怎么实现呢。
import pandas as pd columns = ['name','country'] index = [1,2,3,4] row1 = ['a','China'] row2 = ['b','UK'] row3 = ['c','USA'] row4 = ['d','HK'] df = pd.DataFrame([row1,row2,row3,row4], index=index, columns=columns) df chinese = ['China','HK']
那么想查看数据中是chines的,
df[df.country.isin(chinese)]
查看数据中不是chines的,
到此这篇关于pandas 实现 in 和 not in 的用法及心得的文章就介绍到这了,更多相关pandas in 和 not in 的用法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
python轻松办公将100个Excel中符合条件的数据汇总到1个Excel里
这篇文章主要为大家介绍了python轻松办公将100个Excel中符合条件的数据汇总到1个Excel里示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2023-03-03Python的Twisted框架上手前所必须了解的异步编程思想
Twisted是Python世界中人气最高的framework之一,异步的工作模式使其名扬天下,这里为大家总结了Python的Twisted框架上手前所必须了解的异步编程思想,需要的朋友可以参考下2016-05-05如何使用python的ctypes调用医保中心的dll动态库下载医保中心的账单
这篇文章主要介绍了如何使用python的ctypes调用医保中心的dll动态库下载医保中心的账单,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2020-05-05
最新评论