python缺失值填充方法示例代码

更新时间：2022年12月23日 16:03:37 作者：开始学习的同学

常见的数据缺失填充方式分为很多种,比如删除法、均值法、回归法、KNN、MICE、EM等,下面这篇文章主要给大家介绍了关于python缺失值填充方法的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下

1.找到缺失值

导入数据集

df=pd.read_csv("nba.csv")
df.head(10)

替换异常值（数据集中异常值为“-”）

把数据集中的异常值用“NaN”替换

# 将空值形式的缺失值转换成可识别的类型
data = data.replace('-', np.NaN)

2.计算缺失值的数量

用# isnull() 函数，确认各列是否有缺失值1.

null_all = df.isnull().sum()
print(null_all)

.sum();表示可以显示各个列的缺失值数量。

null_all = df.isnull.any(axis=1)#表示那些行具有缺失值，

.any()表示只要按行或列计算，有缺失值就算入
.all()表示所在行或列全为缺失值才计入
.sum()表示计算列缺失值时，一列有多个缺失值，同理，计算行缺失，计算有多少个行。

3.处理缺失值

3.1:df.dropna():直接删除行列

df表示数据集的名称

dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)

括号内上述参数都是函数默认。

axis=0:表示对行进行删除操作，axis=1:对列删除进行操作
how=‘any’：表示维度 存在“缺失值”就删除相应行/列操作；how=‘all’：进行相关行或列删除操作时，只有所有维度缺失才删除。
thresh=None：等于几表示有几个缺失值存在才会删除所在的行或列。
inplace=False：表示对原来的数据集不进行操作，True时表示对原来的数据集也进行操作。

3.2:df.fillna()填充缺失值

fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

axis : {0 or ‘index’, 1 or ‘columns’}

method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill：将前面的值填充于后面位置。
backfill’, 'bfill：表示将后面的值填充于前面位置。

data.fillna(data.mean())#平均值填充
data.fillna(data.median())#中位数填充

3.3:KNN填充

from sklearn.impute import KNNImputer
imputer = KNNImputer(n_neighbors=4)#邻居样本求平均数
df1=imputer.fit_transform(df)

4.查看数据集的末尾

df.tail(10)

查看末尾10行

总结

到此这篇关于python缺失值填充方法的文章就介绍到这了,更多相关python缺失值填充方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python实现查找系统盘中需要找的字符
这篇文章主要介绍了Python实现查找系统盘中需要找的字符,涉及Python字符查找的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-07-07
python-docx 页面设置详解
今天小编就为大家分享一篇python docx 中页面的设置，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-10-10
Python实现将Excel转换成xml的方法示例
这篇文章主要介绍了Python实现将Excel转换成xml的方法,涉及Python针对Excel文件的读取、遍历、节点设置与xml生成等相关操作技巧,需要的朋友可以参考下
2018-08-08
python使用电子邮件模块smtplib的方法
这篇文章主要介绍了python使用电子邮件模块smtplib的方法,需要的朋友可以参考下
2016-08-08
Python格式化字符串f-string概览(小结)
这篇文章主要介绍了Python格式化字符串f-string概览(小结)，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-06-06
详解Python中常用的激活函数(Sigmoid、Tanh、ReLU等)
激活函数 (Activation functions) 对于人工神经网络模型去学习、理解非常复杂和非线性的函数来说具有十分重要的作用，这篇文章主要介绍了Python中常用的激活函数(Sigmoid、Tanh、ReLU等),需要的朋友可以参考下
2023-04-04
对python3中的RE(正则表达式)-详细总结
今天小编就为大家分享一篇对python3中的RE(正则表达式)-详细总结，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-07-07
python Pydub简单易用的音频处理库使用实例探索
Pydub是一个简单易用的Python库,它让音频处理变得像处理列表或字符串一样简单,你可以用Pydub来剪辑、合并、调整音频文件,以及执行许多其他的音频处理任务,它支持多种音频格式,包括常见的MP3、WAV和AAC
2024-01-01
python爬虫获取新浪新闻教学
在本篇内容中小编给大家分享的是关于python爬虫获取新浪新闻的相关步骤和知识点，需要的可以跟着学习下。
2018-12-12
Python爬虫爬取一个网页上的图片地址实例代码
这篇文章主要介绍了Python爬虫爬取一个网页上的图片地址实例代码，具有一定借鉴价值,需要的朋友可以参考下
2018-01-01