Python缺失值处理方法

 更新时间:2022年05月18日 17:00:47   作者:​ FizzH   ​  
这篇文章主要介绍了Python缺失值处理方法,文章围绕主题展开详细内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下

前言:

前面python重复值处理得方法我们讲了重复值是怎么处理的,今天就来说说缺失值。缺失值主要分为机械原因和人为原因。机械原因就是存储器坏了,机器故障等等原因导致某段时间未能收集到数据。人为原因的情况种类就更多了,如刻意隐瞒等等。

先构建一个含有缺失值的DataFrame,如下:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
print(data)

看出来了吗?np.nan就是NAN值,空值的意思。

在numpy中有一个函数可以用来查看空值,不对,是两个,isnull()和isna()这两函数。

我们分别来试试它们的效果:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
data.isnull()
data.isna()

可以看出,这两函数的作用就是判断数据是不是空值,如果是,就返回true,不是就是false。

通常,对空值的处理有两种方法,一种就是把空值删除,另外一种就是把它填上,我们先说第一种,删除空值,我们可以dropna()这一函数来把空值删除。要注意,它会把含有空值的整行都删掉。例如:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
data.dropna()

上面的例子用了drop函数后,啥都没啦! 

我们可以设置当每行空值多余2个时再删除(低于2个保留),这时候要用到dropna()的参数thresh。

补充空值的话有挺多的方法,有用均值补充,中位数补充等,我们要用到fillna()这一函数。例如,我们用均值来填充上文中的data,

代码如下:

import pandas as pd
import numpy as np
data = pd.DataFrame([[1,np.nan,3],[np.nan,5,np.nan]],columns = ['a','b','c'])
data.fillna(data.mean())

代码运行的结果如下,可以看到空值都被对应列的均值所填充。

到此这篇关于Python缺失值处理方法的文章就介绍到这了,更多相关Python 缺失值 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 关于Python中object类特殊方法的解释

    关于Python中object类特殊方法的解释

    在学习Python的过程中我们会发现有一个类 Object类 ,它是所有类的父类,Object类规定了python用于类的内置函数,今天我们就来看看几个常用的特殊方法吧
    2023-03-03
  • python numpy数组中的复制知识解析

    python numpy数组中的复制知识解析

    这篇文章主要介绍了python numpy数组中的复制知识解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02
  • Python实现读取文本文件并转换为pdf

    Python实现读取文本文件并转换为pdf

    这篇文章主要为大家详细介绍了如何使用Python简便快捷地完成TXT文件到PDF文档的转换,满足多样化的文档处理需求,感兴趣的小伙伴可以参考下
    2024-04-04
  • python的列表List求均值和中位数实例

    python的列表List求均值和中位数实例

    这篇文章主要介绍了python的列表List求均值和中位数实例,具有很好对参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Python使用Flask框架获取当前查询参数的方法

    Python使用Flask框架获取当前查询参数的方法

    这篇文章主要介绍了Python使用Flask框架获取当前查询参数的方法,实例分析了query_string获取查询参数的技巧,需要的朋友可以参考下
    2015-03-03
  • Python sklearn库实现PCA教程(以鸢尾花分类为例)

    Python sklearn库实现PCA教程(以鸢尾花分类为例)

    今天小编就为大家分享一篇Python sklearn库实现PCA教程(以鸢尾花分类为例),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • 用Python生成N层的杨辉三角的实现方法

    用Python生成N层的杨辉三角的实现方法

    这篇文章主要介绍了用Python生成N层的杨辉三角的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • 浅谈python requests 的put, post 请求参数的问题

    浅谈python requests 的put, post 请求参数的问题

    今天小编就为大家分享一篇浅谈python requests 的put, post 请求参数的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • 基于Python实现语音识别和语音转文字

    基于Python实现语音识别和语音转文字

    这篇文章主要为大家详细介绍了如何利用Python实现语音识别和语音转文字功能,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2022-09-09
  • python 如何引入协程和原理分析

    python 如何引入协程和原理分析

    这篇文章主要介绍了python 如何引入协程和原理分析,帮助大家更好得理解和学习python,感兴趣的朋友可以了解下
    2020-11-11

最新评论