简单了解Pandas缺失值处理方法

 更新时间:2019年11月16日 10:35:34   作者:太虚真人  
这篇文章主要介绍了简单了解Pandas缺失值处理方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了简单了解Pandas缺失值处理方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

判断数据是否为NaN:

pd.isnull(df),
pd.notnull(df)

判断缺失值是否存在

np.all(pd.notnull(data)) # 返回false代表有空值
np.any(pd.isnull(data)) #返回true代表有空值

处理方式:

  • 存在缺失值nan,并且是np.nan:
    • 1、删除缺失值:dropna(axis='rows')
      • 注:不会修改原数据,需要接受返回值
    • 2、替换缺失值:fillna(value, inplace=True)
      • value:替换成的值
      • inplace:True:会修改原数据,False:不替换修改原数据,生成新的对象
# 替换存在缺失值的样本的两列
# 替换填充平均值,中位数
movie['Revenue (Millions)'].fillna(movie['Revenue (Millions)'].mean(), inplace=True)
  • 不是缺失值nan,有默认标记的
    • 将不是nan的值替换成np.nan——df.replace(to_replace,value)
      • to_replace- 替换前的值—被替换的
      • value—要修改成的值,上岗的值
      • 再按照是nan的方式处理
# 把一些其它值标记的缺失值,替换成np.nan
wis = wis.replace(to_replace='?', value=np.nan)

SSL报错

以上数据在读取时,可能会报如下错误

URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:833)>

解决办法:

# 全局取消证书验证
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Python 中的对象析构函数__del__ 详情

    Python 中的对象析构函数__del__ 详情

    这篇文章主要介绍了Python 中的对象析构函数del详情,Python 中的类的构造函数 ​​__init__​​ , 每当实例产生就会调用这个构造函下面更多相关内容,需要的小伙伴可以参考一下
    2022-03-03
  • pytorch如何定义新的自动求导函数

    pytorch如何定义新的自动求导函数

    这篇文章主要介绍了pytorch如何定义新的自动求导函数问题,具有很好的参考价值,希望对大家有所帮助。以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
    2022-12-12
  • Python实现把utf-8格式的文件转换成gbk格式的文件

    Python实现把utf-8格式的文件转换成gbk格式的文件

    这篇文章主要介绍了Python实现把utf-8格式的文件转换成gbk格式的文件,本文给出了实现代码并同时剖析了代码的作用,需要的朋友可以参考下
    2015-01-01
  • Python脚本Selenium及页面Web元素定位详解

    Python脚本Selenium及页面Web元素定位详解

    这篇文章主要为大家介绍了Python脚本中如何使用Selenium定位页面Web元素的示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-10-10
  • 一文教你利用Python制作一个C盘清理器

    一文教你利用Python制作一个C盘清理器

    关于电脑的垃圾清理操作,已经有很多的成熟的软件可以帮助我们完成C盘的垃圾清理操作,比如360等等。但是使用三方的清理软件往往伴随着很多的广告,所以本文就来用Python制作一个C盘清理器吧
    2023-03-03
  • Gauss-Seidel迭代算法的Python实现详解

    Gauss-Seidel迭代算法的Python实现详解

    这篇文章主要介绍了Gauss-Seidel迭代算法的Python实现详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-06-06
  • Flask配置四种方式

    Flask配置四种方式

    Flask提供了多种配置方式,可以根据不同的需求和场景进行选择,包括配置类方式、配置文件方式、环境变量方式和实例文件方式,具有一定的参考价值,感兴趣的可以了解一下
    2023-11-11
  • Python做图像处理及视频音频文件分离和合成功能

    Python做图像处理及视频音频文件分离和合成功能

    这篇文章主要介绍了Python做图像处理及视频音频文件分离和合成功能,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • 深入学习Python可变与不可变对象操作实例

    深入学习Python可变与不可变对象操作实例

    Python中的数据类型可以分为可变对象和不可变对象,了解它们之间的区别对于编写高效的Python代码至关重要,本文将详细介绍可变对象和不可变对象的概念,以及如何正确地使用它们来提高代码的性能和可读性
    2023-12-12
  • SpringBoot中的@MessageMapping注解详解

    SpringBoot中的@MessageMapping注解详解

    这篇文章主要介绍了SpringBoot中的@MessageMapping注解详解,Spring Boot 提供了对 WebSocket 的支持,其中 @MessageMapping 注解是一个常用的注解,它可以将一个 Java 方法标记为 WebSocket 的消息处理器,需要的朋友可以参考下
    2023-08-08

最新评论