如何利用Pandas删除某列指定值所在的行

 更新时间:2022年04月27日 16:01:04   作者:DonngZH  
工作中通常会遇到大量的数据集需要处理,其中的一项就是将含有某些数据的行删除掉,下面这篇文章主要给大家介绍了关于如何利用Pandas删除某列指定值所在的行的相关资料,需要的朋友可以参考下

前言

使用pandas对数据操作,筛选数据时,根据任务要求有时不仅要某列中存在空值的行,并且要删除某列中指定值所在行。

1.data.dropna()

默认参数:
data.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

1-1 axis确定删除存在缺失值的行或者是列

#删除含有缺失值的行
axis=0或axis='index'
#删除含有缺失值的列
axis=1或axis='columns'

1-2 how 确定存在缺失值时,是否删除行或者列

how='all'或how=‘any'。
 
how='all'时表示删除全是缺失值的行(列)
 
how='any'时表示删除只要含有缺失值的行(列)

1-3 thresh=n表示保留至少含有n个非na数值的行

data.dropna(thresh=2)

1-4 subset确定要在哪些列中查找缺失值

#在source和target两列中查找缺失值
data.drop(subset = ["source","target"])

1-5 inplace确定是否直接在原DataFrame修改

#删除缺失值后不在原data上修改
inplace = False
#删除缺失值后在原data上修改
inplace = True

2.data.drop

默认参数:
data.drop(
    labels=None,
    axis=0,
    index=None,
    columns=None,
    level=None,
    inplace=False,
    errors='raise',
)

2-1 labels 指定行或者列的名称

#参数axis为0表示在0轴(列)上搜索名为“姓名”的对象,然后删除对象“姓名”对应的行。
data.drop("姓名",axis = 0)
 
#参数axis为0表示在1轴(行)上搜索名为“姓名”的对象,然后删除对象“姓名”对应的列。
data.drop("姓名",axis = 1)

2-2 index 指定要删除的行

#删除data中索引为0和1的行
data.drop(index = [0,1])

2-3 columns 指定要删除的列

#删除data中列名为“source”和“target”的列
data.drop(columns=['source', 'target'])

3.实例

任务需求:删掉“ZH_Term_len”列中值为0的全部行。

3-1 统计0的数量

#统计“ZH_Term_len”一列中有多少个0
data["ZH_Term_len"].value_counts()

3-2 找出0的索引

data[(data.ZH_Term_len == 0)].index.tolist() 

3-3 使用drop函数以及index参数删除所在的行

data =  data.drop(index = data[(data.ZH_Term_len == 0)].index.tolist())

3-4 查看数据

data.info()

3-5 将索引重新排序

#会将标签重新从零开始顺序排序,使用参数设置drop=True删除旧的索引序列
data = data.reset_index(drop=True)

3-6 统计“ZH_Term_len”列中值的数量

 统计后发现,“ZH_Term_len”列中值为0的行已经全部被删除掉。

总结

到此这篇关于如何利用Pandas删除某列指定值所在行的文章就介绍到这了,更多相关Pandas删除指定值所在行内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python爬虫Mitmproxy安装使用学习笔记

    python爬虫Mitmproxy安装使用学习笔记

    这篇文章主要介绍了python爬虫Mitmproxy学习笔记分享,有需要的朋友可以收藏学习下,希望可以对你有所帮助,大家一起共同学习,共同进步
    2021-09-09
  • 使用Flask创建简单的图片上传站点的流程步骤

    使用Flask创建简单的图片上传站点的流程步骤

    在网络应用程序中,实现图片上传功能是一项常见的需求,Flask框架提供了简单而灵活的工具,使得构建这样的功能变得相对简单,本文将介绍如何使用Flask框架创建一个简单的图片上传站点,以及其中涉及的关键技术和步骤,需要的朋友可以参考下
    2024-05-05
  • 简单谈谈Python中的元祖(Tuple)和字典(Dict)

    简单谈谈Python中的元祖(Tuple)和字典(Dict)

    这篇文章主要介绍了关于Python中元祖(Tuple)和字典(Dict)的相关资料,文中通过示例代码介绍的非常详细,相信对大家具有一定的参考价值,需要的朋友们下面来一起看看吧。
    2017-04-04
  • python利用pytesseract 实现本地识别图片文字

    python利用pytesseract 实现本地识别图片文字

    这篇文章主要介绍了python利用pytesseract 实现本地识别图片文字,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-12-12
  • django rest framework使用django-filter用法

    django rest framework使用django-filter用法

    这篇文章主要介绍了django rest framework使用django-filter用法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • python: 自动安装缺失库文件的方法

    python: 自动安装缺失库文件的方法

    今天小编就为大家分享一篇python: 自动安装缺失库文件的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python 3.8正式发布重要新功能一览

    Python 3.8正式发布重要新功能一览

    最新版本的Python发布了!今年夏天,Python 3.8发布beta版本,但在2019年10月14日,第一个正式版本已准备就绪。现在,我们都可以开始使用新功能并从最新改进中受益
    2019-10-10
  • python2和python3应该学哪个(python3.6与python3.7的选择)

    python2和python3应该学哪个(python3.6与python3.7的选择)

    许多刚入门 Python 的朋友都在纠结的的问题是:我应该选择学习 python2 还是 python3,Python 3.7 已经发布了,目前Python的用户,主要使用的版本 应该是 Python3.6 和 Python2.7 ,那么是不是该转到 Python 3.7 呢
    2019-10-10
  • python分布式计算dispy的使用详解

    python分布式计算dispy的使用详解

    今天小编就为大家分享一篇python分布式计算dispy的使用详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • pytorch+sklearn实现数据加载的流程

    pytorch+sklearn实现数据加载的流程

    这篇文章主要介绍了pytorch+sklearn实现数据加载,之前在训练网络的时候加载数据都是稀里糊涂的放进去的,也没有理清楚里面的流程,今天整理一下,加深理解,也方便以后查阅,需要的朋友可以参考下
    2022-11-11

最新评论