pandas数据缺失的两种处理办法

 更新时间:2024年12月30日 11:18:12   作者:右拐三次就是左  
本文主要介绍了在pandas中处理数据缺失和0值,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

数据缺失通常有两种情况:

  • 空,None等,在pandas是NAN(和np的nan一样)
  • 另一种就是0

1.为NaN数据的处理

1.判断这列有没有NaN

has_nan = df['age'].isnull().any()
print(has_nan)

或者直接在控制台根据数据进行判断

在这里插入图片描述

2.处理方式

在这里插入图片描述

假设我 操作的是original_publication_year这一列,如何操作才能得到过滤后的显示样式

在这里插入图片描述

处理方式1:只考虑单列

df2 = df[pd.notnull(df["original_publication_year"]) 

这行代码的目的是 去除 original_publication_year 列中含有 NaN 值的行,并生成一个新的 DataFrame(df2),包含了所有 original_publication_year 列中不含 NaN 值的行。

3. df["original_publication_year"] 是获取 df 数据框中的 original_publication_year 这一列。

4. pd.notnull(df["original_publication_year")用于检查数据中的每个元素是否不是 NaN。返回一个布尔值的 Series.
True 的行会被保留;
False 的行会被排除(Book2何Book4被去除)。

5. 返回一个所有 original_publication_year 列中不是NaN 的行新的DataFrame

处理方式2:删除NaN所在的行

dropna(axis=0,how='any',inplace=False)

any表示有就删,all表示全部是NaN才删
inplace表示是否进行原地修改

处理方式3:填充数据

mean_value = df["original_publication_year"].mean()  # 计算均值
df_filled=df["original_publication_year"].fillna(mean_value)

在这里插入图片描述

t.fillna(t.mean()) #填充均值
t["列名"]=t["列名"].fillna(t["列名"].mean())
#单独对某一列进行操作
t.fiallna(t.median()) #填充中值
t.fillna(0)

2:为0数据的处理

t[t==0]=np.nan # 赋值为NaN
# 当然并不是每次为0的数据都需要处理
# 计算平均值等情况,nan是不参与计算的,但是0会的

设置成NaN后用处理NaN的方法处理。

到此这篇关于pandas数据缺失的处理办法解决的文章就介绍到这了,更多相关pandas数据缺失内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python实现GUI学生管理系统的示例代码

    Python实现GUI学生管理系统的示例代码

    这篇文章主要为大家介绍了如何留Python语言实现简易的GUI学生管理系统,文中的示例代码讲解详细,对我们学习Python有一定帮助,需要的可以参考下
    2022-06-06
  • Python获取数据库数据并保存在excel表格中的方法

    Python获取数据库数据并保存在excel表格中的方法

    今天小编就为大家分享一篇Python获取数据库数据并保存在excel表格中的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • python模拟登录百度代码分享(获取百度贴吧等级)

    python模拟登录百度代码分享(获取百度贴吧等级)

    python模拟登录百度,实现了登录并读取百度关注贴吧列表,百度登录还是有点麻烦的,由于用的ssl,所以要先获取token,然后再登录,这个用finddle2分析下,还是比较好解决的
    2013-12-12
  • Python中工厂模式的实现小结

    Python中工厂模式的实现小结

    工厂模式是一种创建型设计模式,通过定义一个工厂类,将对象的实例化过程封装起来,本文主要介绍了Python中工厂模式的实现小结,具有一定的参考价值,感兴趣的可以了解一下
    2023-11-11
  • Python使用SQLAlchemy进行复杂查询的操作代码

    Python使用SQLAlchemy进行复杂查询的操作代码

    SQLAlchemy 是 Python 生态系统中非常流行的数据库处理库,它提供了一种高效、简洁的方式与数据库进行交互,在数据驱动的应用程序中,复杂查询是必不可少的,本文将通过一些常见的示例介绍如何使用 SQLAlchemy 编写复杂查询,需要的朋友可以参考下
    2024-10-10
  • Python实现蓝线挑战特效的示例代码

    Python实现蓝线挑战特效的示例代码

    在抖音曾经火了一阵子的蓝线挑战特效,其原理很简单。本文将试着用opencv-python实现这个效果,做了摄像头版本和视频处理版本,感兴趣的可以学习一下
    2022-10-10
  • Python实现基于权重的随机数2种方法

    Python实现基于权重的随机数2种方法

    这篇文章主要介绍了Python实现基于权重的随机数2种方法,本文直接给出实现代码,需要的朋友可以参考下
    2015-04-04
  • python实现字符串和日期相互转换的方法

    python实现字符串和日期相互转换的方法

    这篇文章主要介绍了python实现字符串和日期相互转换的方法,涉及Python中time和datetime函数使用技巧,需要的朋友可以参考下
    2015-05-05
  • python实现将字符串中的数字提取出来然后求和

    python实现将字符串中的数字提取出来然后求和

    这篇文章主要介绍了python实现将字符串中的数字提取出来然后求和,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • python基于moviepy实现音视频剪辑

    python基于moviepy实现音视频剪辑

    为了方便学习和复习,需要把一些长音视频剪成一些小片段。本文介绍如何用Python实现,把音视频中的某一些片段剪出来。
    2021-06-06

最新评论