Pandas之Dropna滤除缺失数据的实现方法

更新时间：2019年06月25日 11:55:31 作者：yungeisme

这篇文章主要介绍了Pandas之Dropna滤除缺失数据的实现方法，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

约定：

import pandas as pd
import numpy as np
from numpy import nan as NaN

滤除缺失数据

pandas的设计目标之一就是使得处理缺失数据的任务更加轻松些。pandas使用NaN作为缺失数据的标记。

使用dropna使得滤除缺失数据更加得心应手。

一、处理Series对象

通过**dropna()**滤除缺失数据：

se1=pd.Series([4,NaN,8,NaN,5])
print(se1)
se1.dropna()

代码结果：

0    4.0
1    NaN
2    8.0
3    NaN
4    5.0
dtype: float64

0    4.0
2    8.0
4    5.0
dtype: float64

通过布尔序列也能滤除：

se1[se1.notnull()]

代码结果：

0    4.0
2    8.0
4    5.0
dtype: float64

二、处理DataFrame对象

处理DataFrame对象比较复杂，因为你可能需要丢弃所有的NaN或部分NaN。

df1=pd.DataFrame([[1,2,3],[NaN,NaN,2],[NaN,NaN,NaN],[8,8,NaN]])
df1

代码结果：

	0	1	2
0	1.0	2.0	3.0
1	NaN	NaN	2.0
2	NaN	NaN	NaN
3	8.0	8.0	NaN

默认滤除所有包含NaN：

df1.dropna()

代码结果：

	0	1	2
0	1.0	2.0	3.0

传入**how=‘all'**滤除全为NaN的行：

df1.dropna(how='all')

代码结果：

	0	1	2
0	1.0	2.0	3.0
1	NaN	NaN	2.0
3	8.0	8.0	NaN

传入axis=1滤除列：

df1[3]=NaN
df1

代码结果：

	0	1	2	3
0	1.0	2.0	3.0	NaN
1	NaN	NaN	2.0	NaN
2	NaN	NaN	NaN	NaN
3	8.0	8.0	NaN	NaN

df1.dropna(axis=1,how="all")

代码结果：

传入thresh=n保留至少有n个非NaN数据的行：

df1.dropna(thresh=1)

df1.dropna(thresh=3)

代码结果：

	0	1	2
0	1.0	2.0	3.0
1	NaN	NaN	2.0
2	NaN	NaN	NaN
3	8.0	8.0	NaN

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

Mac OS X10.9安装的Python2.7升级Python3.3步骤详解
Mac OS X10.9默认带了Python2.7，不过现在Python3.3.3出来了，如果想使用最新版本，赶紧升级下吧。基本步骤如下
2013-12-12
Python入门篇之正则表达式
正则表达式是一个很有用的工具，可处理复杂的字符匹配和替换工作。在Python中内置了一个re模块以支持正则表达式。本文我们就来详细探讨下Python中正则表达式。
2014-10-10
Python标准库pathlib操作目录和文件
这篇文章主要为大家介绍了Python标准库pathlib操作目录和文件的示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步
2021-11-11
Python+OpenCV之图像轮廓详解
这篇文章主要为大家详细介绍了Python OpenCV实现图像轮廓的方法，文中的示例代码讲解详细，具有一定的借鉴价值，感兴趣的可以了解一下
2022-09-09
Python如何把Spark数据写入ElasticSearch
这篇文章主要介绍了Python如何把Spark数据写入ElasticSearch,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-04-04
scrapy框架携带cookie访问淘宝购物车功能的实现代码
这篇文章主要介绍了scrapy框架携带cookie访问淘宝购物车,本文通过实例代码图文详解给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2020-07-07
numpy中生成随机数的几种常用函数(小结)
这篇文章主要介绍了numpy中生成随机数的几种常用函数，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-08-08
python机器学习Logistic回归原理推导
这篇文章主要为大家介绍了python机器学习Logistic回归原理推导，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-06-06
Django读取Mysql数据并显示在前端的实例
今天小编就为大家分享一篇Django读取Mysql数据并显示在前端的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-05-05
关于TensorBoard可视化不显示数据问题No scalar data was&nbs
这篇文章主要介绍了如何解决TensorBoard可视化不显示数据问题No scalar data was found,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2023-09-09

Pandas之Dropna滤除缺失数据的实现方法

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具