pandas 空数据处理方法详解

 更新时间:2019年11月02日 11:19:20   作者:蔡文君  
这篇文章主要介绍了pandas 空数据处理方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了pandas 空数据处理方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

方法一:直接删除

1.查看行或列是否有空格(以下的df为DataFrame类型,axis=0,代表列,axis=1代表行,以下的返回值都是行或列索引加上布尔值)

isnull方法

查看行:df.isnull().any(axis=1)

查看列:df.isnull().any(axis=0)

notnull方法:

查看行:df.notnull().all(axis=1)

查看列:df.notnull().all(axis=0)

例子:

df.isnull().any(axis=1) # 检测行内是否有空值
0 False
1 True
2 False
3 True
4 False
5 True
6 False
7 True
8 False
9 False
dtype: bool

注意点:以上方法都可以用~取反的办法获取相反的结果

2.在1的前提下使用df.loc[],可取出1中筛选出数据的具体数据如:

df.loc[df.isnull().any(axis=1)]

取出这几行的索引可用属性index如:df.loc[df.isnull().any(axis=1)].index

得到这些索引后可以使用drop方法进行删除如:

注意:drop方法中的axis值与其他方法相反,axis=0表示行,=1表示列。

df.drop(labels=drop_index, axis=0)

总结下来为4步:

一.使用isnull或notnull筛选:df.isnull().any(axis=0)

二.使用loc取出具体数据:df.loc[df.isnull().any(axis=1)]

三:取出这些数据的索引:df.loc[df.isnull().any(axis=1)].index

四.使用drop删除:df.drop(labels=drop_index, axis=0)

方法二:填充空值

步骤和方法一前几步相同

isnull()

notnull()

dropna(): 过滤丢失数据(df.dropna() 可以选择过滤的是行还是列(默认为行):axis中0表示行,1表示的列)

fillna(): 填充丢失数据(可以选择自主添加数据,或者用表中原有的数据进行补充)

1.使用dropna(不常用):df.dropna(axis=0)

2.使用fillna(常用):

一.df.fillna(value=666)给所有的控制赋值为666

二.df.fillna(method='ffill', axis=0) # axis=0表示在垂直方向填充(axis值:0为垂直,1为水平),使用上方的值对空值进行填充,组合起来就是,使用垂直方向上方的值对当前位置的值进行填充

三.df.fillna(method='bfill', axis=1) # axis=1表示在水平方向填充(axis值为0垂直1为水平),bfill表示使用后面的值对空值进行填充,组合起来就是,使用水平方向右边的值对当前位置的值进行填充

总结:ffill(前)和bfill(后)决定前或后,axis决定垂直或水平

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python手写均值滤波

    python手写均值滤波

    这篇文章主要为大家详细介绍了python手写均值滤波的相关代码,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-02-02
  • 浅谈python中的正则表达式(re模块)

    浅谈python中的正则表达式(re模块)

    本篇文章主要介绍了浅谈python中的正则表达式(re模块),通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配,有兴趣的可以了解一下
    2017-10-10
  • python 字符串常用函数详解

    python 字符串常用函数详解

    这篇文章主要介绍了python 字符串常用函数,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-09-09
  • Python正则表达式re.sub()用法详解

    Python正则表达式re.sub()用法详解

    re.sub用于替换字符串中的匹配项,下面这篇文章主要给大家介绍了关于Python正则表达式re.sub()用法的相关资料,文中通过实例代码以及图文介绍的非常详细,需要的朋友可以参考下
    2022-09-09
  • Python实现EXCEL表格的排序功能示例

    Python实现EXCEL表格的排序功能示例

    这篇文章主要介绍了Python实现EXCEL表格的排序功能示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • Python标准库之time库的使用教程详解

    Python标准库之time库的使用教程详解

    这篇文章主要介绍了Python的time库的使用教程,文中有非常详细的代码示例,对正在学习python基础的小伙伴们有非常好的帮助,需要的朋友可以参考下
    2022-04-04
  • 基于Python实现n-gram文本生成的示例代码

    基于Python实现n-gram文本生成的示例代码

    N-gram是自然语言处理中常用的技术,它可以用于文本生成、语言模型训练等任务,本文主要介绍了如何在Python中实现n-gram文本生成,需要的可以参考下
    2024-01-01
  • PyTorch如何创建自己的数据集

    PyTorch如何创建自己的数据集

    这篇文章主要介绍了PyTorch如何创建自己的数据集,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • Python进阶之高级用法详细总结

    Python进阶之高级用法详细总结

    今天带各位小伙伴学习一下Python高级语法,主要有Lambda表达式,map函数,filter函数,reduce函数,三大推导式等,文中有非常详细的介绍,需要的朋友可以参考下
    2021-05-05
  • pytest-sugar 执行过程中显示进度条的脚本分享

    pytest-sugar 执行过程中显示进度条的脚本分享

    Pytest-sugar是一款用来改善控制台显示的插件,增加了进度条显示,使得在用例执行过程中可以看到进度条,而且进度条是根据用例是否通过标注不同颜色,非常醒目,接下来通过本文给大家分享下pytest sugar 显示进度条的脚本,感兴趣的朋友一起看看吧
    2022-12-12

最新评论