python中dropna()函数的作用举例说明
在Python中,dropna()
是一个Pandas库中的函数,用于从数据框(DataFrame)中删除包含缺失值(NaN)的行或列。它用于数据清洗和预处理阶段,以便去除缺失值,使数据更加规整。
dropna()函数的语法如下:
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
参数说明:
axis
:可选参数,表示删除行还是列。默认值为0,表示删除包含缺失值的行;设置为1表示删除包含缺失值的列。how
:可选参数,表示删除的条件。默认值为’any’,表示只要存在一个缺失值就删除整行或整列;设置为’all’表示只有当整行或整列都是缺失值时才删除。thresh
:可选参数,表示在删除之前需要满足的非缺失值的最小数量。如果行或列中的非缺失值数量小于等于thresh
,则会被删除。subset
:可选参数,用于指定要检查缺失值的特定列名或行索引。inplace
:可选参数,表示是否对原始数据进行就地修改。默认值为False,表示不修改原始数据,而是返回一个新的数据框。
下面是一些使用dropna()函数的示例:
import pandas as pd # 创建包含缺失值的数据框 data = {'A': [1, 2, None, 4], 'B': [None, 6, 7, 8], 'C': [9, 10, 11, 12]} df = pd.DataFrame(data) # 删除包含缺失值的行 cleaned_df = df.dropna() # 删除包含缺失值的列 cleaned_df = df.dropna(axis=1) # 只删除整行或整列都是缺失值的行或列 cleaned_df = df.dropna(how='all') # 至少需要2个非缺失值才保留行或列 cleaned_df = df.dropna(thresh=2) # 只在特定列中检查缺失值 cleaned_df = df.dropna(subset=['A', 'C']) # 在原始数据上进行就地修改 df.dropna(inplace=True)
这些示例展示了dropna()
函数的不同用法,根据你的具体需求选择合适的参数设置。
附:Python丢弃含空值的行、列
创建DataFrame数据:
import numpy as np import pandas as pd a = np.ones((11,10)) for i in range(len(a)): a[i,:i] = np.nan d = pd.DataFrame(data=a) print(d)
按行删除:存在空值,即删除该行
# 按行删除:存在空值,即删除该行 print(d.dropna(axis=0, how='any'))
按行删除:所有数据都为空值,即删除该行
# 按行删除:所有数据都为空值,即删除该行 print(d.dropna(axis=0, how='all'))
按列删除:该列非空元素小于5个的,即删除该列
# 按列删除:该列非空元素小于5个的,即删除该列 print(d.dropna(axis='columns', thresh=5))
设置子集:删除第0、5、6、7列都为空的行
# 设置子集:删除第0、5、6、7列都为空的行 print(d.dropna(axis='index', how='all', subset=[0,5,6,7]))
设置子集:删除第5、6、7行存在空值的列
# 设置子集:删除第5、6、7行存在空值的列 print(d.dropna(axis=1, how='any', subset=[5,6,7]))
原地修改
# 原地修改 print(d.dropna(axis=0, how='any', inplace=True)) print("==============================") print(d)
总结
到此这篇关于python中dropna()函数的文章就介绍到这了,更多相关python dropna()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
Python 中eval()函数的正确使用及其风险分析(使用示例)
eval()是一个功能强大的工具,但使用时必须非常小心,了解其工作原理和潜在的风险是确保安全使用的关键,通过遵循上述建议,可以在享受eval()带来的便利的同时,最大限度地减少安全风险,本文介绍Python 中`eval()`函数的正确使用及其风险分析,感兴趣的朋友一起看看吧2024-07-07
最新评论