pandas提取数据的6种方法汇总

 更新时间:2023年08月22日 09:47:10   作者:小琳爱分享  
这篇文章主要介绍了pandas提取数据的6种方法汇总,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas提取数据的6种方法

pandas是Python数据分析必备工具,它有强大的数据清洗能力,往往能用非常少的代码实现较复杂的数据处理。

五个方面:

  • 比较运算:、<、>、>=、<=、!=
  • 范围运算:between(left,right)
  • 字符筛选:str.contains(pattern或字符串,na=False)
  • 逻辑运算:&(与)、|(或)、not(取反)
  • 比较函数:eq, ne, le, lt, ge, gt(相当于,=!,<=,<,>=,>)

apply和isin函数

编码使用的是Jupyter Notebook,可支持网页编辑,会在后续的文章中写使用方法~~~

首先读取数据

import pandas as pd
data=pd.read_excel('超市运营数据模板.xlsx')
print(data)

data.dtypes可以获取数据类型

1.筛选性别为’男’的数据

①第一种方法,用比较运算符‘==’:

data[data.性别=='男']

②第二种方法,用比较函数’eq’:

data[data['性别'].eq('男')]

2.筛选入学年份小于等于2017的数据

①第一种方法,用比较运算符‘<=’:

data[data.入学年份<=2017]

②第二种方法,用比较函数’le’:

data[data['入学年份'].le(2017)]

3.筛选入学年份大于2017的数据

data[data.入学年份>2017]

②第二种方法,用比较函数’ge’:

data[data['入学年份'].gt(2017)]

4.筛选除姓名’王五’外的数据

①第一种方法,用比较运算符‘!=’:

data[data.姓名!='王五']

②第二种方法,用比较函数’ne’:

data[data['姓名'].ne('王五')]

!!!数据更改!!!

5.筛选2018年9月的入学的学生

data['入学年份']=data["入学年份"].astype('datetime64')  #如果已为日期格式则此步骤可省略
print(data['入学年份'])
import datetime
s_date = datetime.datetime.strptime('2018-08-31', '%Y-%m-%d').date()  #起始日期
e_date = datetime.datetime.strptime('2018-10-01', '%Y-%m-%d').date()  #结束日期

①第一种方法,用逻辑运算符号’>’ ‘<‘和’&’:

Pandasdatetime64[ns]不能直接与datetime.date相比,需要用pd.Timestamp进行转化

data[(data.入学年份>pd.Timestamp(s_date))&(data.入学年份<pd.Timestamp(e_date))]

②第二种,用比较函数’gt’‘lt’和’&’:

data[(data['入学年份'].lt(pd.Timestamp(e_date)))&(data['入学年份'].gt(pd.Timestamp(s_date)))]

③第三种,用apply函数实现:

id_a=data.入学年份.apply(lambda x: x.year ==2018  and x.month==9)
data[id_a]

④第四种,用between函数实现:

id_b=data.入学年份.between(pd.Timestamp(s_date),pd.Timestamp(e_date))
data[id_b]

6.筛选“班级”包含’1503’的数据

①第一种,用contains函数:

data['班级']=data['班级'].values.astype('str')  #将该列转换为字符数据类型
id_c=data.班级.str.contains('1503',na=False)
data[id_c]

②第二种,用isin函数:

id_i=data.类别ID.isin(['000'])  #接受一个列表
data[id_i]
#isin函数搞不定,因为它只能判断该列中元素是否在列表中

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python numpy 模块介绍

    Python numpy 模块介绍

    这篇文章主要介绍了Python numpy 模块,在motplotlib的学习过程中,我们使用最多的就是numpy模块。下面我们将使用numpy进行创建数组、切片、索引、广播等功能实操,需要的朋友可以参考一下
    2022-01-01
  • Python使用Dijkstra算法实现求解图中最短路径距离问题详解

    Python使用Dijkstra算法实现求解图中最短路径距离问题详解

    这篇文章主要介绍了Python使用Dijkstra算法实现求解图中最短路径距离问题,简单描述了Dijkstra算法的原理并结合具体实例形式分析了Python使用Dijkstra算法实现求解图中最短路径距离的相关步骤与操作技巧,需要的朋友可以参考下
    2018-05-05
  • Python networkx中获取图的邻接矩阵方式

    Python networkx中获取图的邻接矩阵方式

    这篇文章主要介绍了Python networkx中获取图的邻接矩阵方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12
  • Python常用数据分析模块原理解析

    Python常用数据分析模块原理解析

    这篇文章主要介绍了Python常用数据分析模块原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • Django启动时找不到mysqlclient问题解决方案

    Django启动时找不到mysqlclient问题解决方案

    这篇文章主要介绍了Django启动时找不到mysqlclient问题解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • Python异常模块traceback用法实例分析

    Python异常模块traceback用法实例分析

    这篇文章主要介绍了Python异常模块traceback用法,结合实例形式分析了Python异常模块traceback的基本功能、使用方法及相关操作注意事项,需要的朋友可以参考下
    2019-10-10
  • python实现猜数字小游戏

    python实现猜数字小游戏

    这篇文章主要,具有一定的参考价值,感兴趣的小伙伴们可以参考一下介绍了Python实现猜数字小游戏,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-06-06
  • python实现图书馆抢座(自动预约)功能的示例代码

    python实现图书馆抢座(自动预约)功能的示例代码

    这篇文章主要介绍了python实现图书馆抢座(自动预约)功能,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-09-09
  • Python推导式之字典推导式和集合推导式使用体验

    Python推导式之字典推导式和集合推导式使用体验

    这篇文章主要为大家介绍了Python推导式之字典推导式和集合推导式使用示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-06-06
  • Python实现的三层BP神经网络算法示例

    Python实现的三层BP神经网络算法示例

    这篇文章主要介绍了Python实现的三层BP神经网络算法,结合完整实例形式分析了Python三层BP神经网络算法的具体实现与使用相关操作技巧,需要的朋友可以参考下
    2018-02-02

最新评论