pandas中read_csv的缺失值处理方式

更新时间：2019年12月19日 09:30:26 作者：dzysunshine

今天小编就为大家分享一篇pandas中read_csv的缺失值处理方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

今天遇到的问题是，要将一份csv数据读入dataframe，但某些列中含有NA值。对于这些列来说，NA应该作为一个有意义的level，而不是缺失值，但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。

看pandas文档中read_csv函数中这两个参数的描述，默认会将'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''转换为NaN，且na_values参数还支持定义另外的应处理为缺失值的值。

值得注意的是keep_default_na参数，这个参数的作用是决定要不要保留默认应该转换的缺失值列表，将这个参数设为False之后同时不定义na_values参数，就可以在读取文件时不将任何值转换为缺失值NaN。

例：

import pandas as pd
df = pd.read_csv('train.csv', keep_default_na=False)

以上这篇pandas中read_csv的缺失值处理方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

浅谈pandas关于查看库或依赖库版本的API原理
本文主要介绍了浅谈pandas关于查看库或依赖库版本的API原理，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2022-06-06
Python 4种实现定时任务的方案
这篇文章主要给大家分享了Python 4种实现定时任务的方案，运用 while True: + sleep()、Timeloop 库、threading.Timer 、内置模块 sched ，下面就来看看具体的实现过程吧
2021-12-12
OpenCV半小时掌握基本操作之直线检测
这篇文章主要介绍了OpenCV基本操作之直线检测，本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-09-09
Python生成并下载文件后端代码实例
这篇文章主要介绍了Python生成并下载文件后端代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-08-08
Python实现自动识别数字验证码
这篇文章主要为大家详细介绍了如何使用Python来自动识别数字验证码,以便在需要时自动填写或验证验证码,有需要的小伙伴可以参考一下
2024-04-04
django drf框架中的user验证以及JWT拓展的介绍
这篇文章主要介绍了django drf框架中的user验证以及JWT拓展的介绍,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-08-08
Flask response 对象详情
在 Flask 中，响应使用 Response 对象表示，响应报文中的大部分内容由服务器处理，一般情况下，我们只负责返回主体内容即可。在之前的文章中，我们了解到 Flask 会先匹配请求 url 的路由，调用对应的视图函数，视图函数的返回值构成了响应报文的主体内容。
2021-11-11
python更换国内镜像源三种实用方法
这篇文章主要给大家介绍了关于python更换国内镜像源三种实用方法的相关资料,更换Python镜像源可以帮助解决使用pip安装包时速度过慢或无法连接的问题,需要的朋友可以参考下
2023-09-09
Python人工智能之sg2im文字转图像
这篇文章主要介绍了Python人工智能中使用sg2im把文字转成图像的方法，sg2im是一个由Google开发的开源项目，它专注于将场景图形转换为图像，借助sg2im就可以把文字转换成图像，需要的朋友可以参考下
2021-11-11
TensorFlow查看输入节点和输出节点名称方式
今天小编就为大家分享一篇TensorFlow查看输入节点和输出节点名称方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-01-01

pandas中read_csv的缺失值处理方式

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具