使用Pandas修改DataFrame中某一列的值

 更新时间:2022年12月22日 10:17:22   作者:Sun_Sherry  
DataFrame是Pandas中的主要数据结构之一,下面这篇文章主要给大家介绍了关于使用Pandas修改DataFrame中某一列的值的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下

写这篇博客主要是因为在修改DataFrame列值的时候经常遇到bug,但到目前还没把这种错误复现出来。

DataFrame是Pandas中的主要数据结构之一,本篇博客主要介绍如何DataFrame中某一列的值进行修改。

1 常规方法

这部分主要介绍修改DataFrame列值的常规方法。为了方便后续说明先构建如下数据:

import pandas as pd
import numpy as np
df=pd.DataFrame([['A',1],['B',2],['C',5],['D',4],['E',10],['F',13],['G',8]],
                columns=['col_1','col_2'],
                index=list('abcdefg'))

df结果如下:

  • 使用常量修改DataFrame列的值

使用一个常量对DataFrame列中的数据进行修改时,代码举例如下:

df1=df.copy()
df1['col_1']='H'
df1.loc[['a','c','d'],'col_2']=100 #将指定索引的列值进行修改
df1.iloc[4:,-1]=200 

df1的结果如下:

  • 使用List\array修改DataFrame列的值

当需要对DataFrame列中的多个值进行修改时,可以使用List或array等变量型数据来对其进行修改。具体代码如下:

df2=df.copy()
df2['col_1']=list(range(7))
df2.loc[df2.index<='d','col_2']=np.array([15,20,25,30])
df2.iloc[4:,-1]=np.array([10,5,0])

df2的结果如下:

  • 使用Series/DataFrame修改DataFrame列的值

除了以上两种数据类型之外,还可以使用Series型数据来修改DataFrame列的值。但使用这种方法时,需要索引对齐,否则会出错。具体举例如下:

df3=df.copy()
df3['col_1']=pd.Series([1,2,3,4,5,6,7]) #索引不对齐时不会报错,但没有成功修改列值。
df3.loc[['a','b','c'],'col_2']=pd.Series([100,200,300],index=list('abc'))
df3.iloc[3:,-1]=pd.DataFrame([[4000],[5000],[6000],[7000]],index=list('cdef'))

其结果如下:

2. replace方法

DataFrame对象自带的方法replace()也可以实现列值的修改。该方法中的参数主要有以下几个:

参数作用
to_replace确定需要修改列值的数据。可接受的数据类型有:str, regex, list, dict, Series, int, float, or None
value指定修改后的值。可接受的数据类型有:scalar, dict, list, str, regex, default None
inplace是否本地置换
limit指定前后填充的最大次数
regex正则表达式符号。如果需要在to_replace中使用字符串形式的正则表达式对数据进行筛选的话,需要将其设置为True。
method填充方式。‘pad’, ‘ffill’, ‘bfill’, None

创建如下数据,具体如下:

df=pd.DataFrame([['A','A'],['B','B'],['C',5],['D',4]],
                columns=['col_1','col_2'],
                index=list('abcd'))

df的结果如下:

  • 对整个DataFrame中的指定数据进行替换
#A替换为aaa,B替换为bbb,4替换为100
df_1=df.replace(to_replace=['A','B',4],value=['aaa','bbb',100])
#将A替换为AAAA
df_2=df.replace(to_replace='A',value='AAAA')
#将A替换为AAAAA,5替换为2000
df_3=df.replace(to_replace={"A":'AAAAA',5:2000})

其结果如下:

  • 对DataFrame中的不同列指定不同的替换方式
#对于col_1列:将A替换为1,B替换为2
#对于col_2列:将A替换为100,B替换为200
df_4=df.replace({"col_1":{'A':1,'B':2},"col_2":{"A":100,"B":200}})

其结果如下:

  • 使用正则表达式筛选数据
#将A\B替换成new
df_5=df.replace(to_replace=r'[AB]',value='new',regex=True)

其结果如下:

补充:DataFrame修改某一行某一列的值[坑点]

# df.iloc[index]['column_name'] = val 这种方式是错误的
df['column_name'].iloc[i] = val # 正确

总结 

到此这篇关于使用Pandas修改DataFrame中某一列值的文章就介绍到这了,更多相关Pandas修改DataFrame某一列的值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python魔法方法-自定义序列详解

    python魔法方法-自定义序列详解

    下面小编就为大家带来一篇python魔法方法-自定义序列详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-07-07
  • 对Python 多线程统计所有csv文件的行数方法详解

    对Python 多线程统计所有csv文件的行数方法详解

    今天小编就为大家分享一篇对Python 多线程统计所有csv文件的行数方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • 详解Python中的Numpy、SciPy、MatPlotLib安装与配置

    详解Python中的Numpy、SciPy、MatPlotLib安装与配置

    这篇文章主要介绍了详解Python中的Numpy、SciPy、MatPlotLib安装与配置,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-11-11
  • Python快速排序算法实例分析

    Python快速排序算法实例分析

    这篇文章主要介绍了Python快速排序算法,简单说明了快速排序算法的原理、实现步骤,并结合具体实例分析了Python实现快速排序的相关操作技巧,需要的朋友可以参考下
    2017-11-11
  • python 调用HBase的简单实例

    python 调用HBase的简单实例

    下面小编就为大家带来一篇python 调用HBase的简单实例。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-12-12
  • pytorch如何自定义数据集

    pytorch如何自定义数据集

    这篇文章主要介绍了pytorch自定义数据集,在识别手写数字的例子中,数据集是直接下载的,但如果我们自己收集了一些数据,存在电脑文件夹里,我们该如何把这些数据变为可以在PyTorch框架下进行神经网络训练的数据集呢,即如何自定义数据集呢,需要的朋友可以参考下
    2024-01-01
  • Python编程中对super函数的正确理解和用法解析

    Python编程中对super函数的正确理解和用法解析

    可能有人会想到,Python中既然可以直接通过父类名调用父类方法为什么还会存在super函数?其实,很多人对Python中的super函数的认识存在误区,本文我们就带来在Python编程中对super函数的正确理解和用法解析
    2016-07-07
  • 更改Python的pip install 默认安装依赖路径方法详解

    更改Python的pip install 默认安装依赖路径方法详解

    今天小编就为大家分享一篇更改Python的pip install 默认安装依赖路径方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • Python+PyQt5制作一个图片查看器

    Python+PyQt5制作一个图片查看器

    在PyQt中可以使用很多方式实现照片查看器,本文将利用QGraphicsView类来实现图片查看器的制作,感兴趣的小伙伴快跟随小编一起动手试一试
    2022-03-03
  • Python 日志logging模块用法简单示例

    Python 日志logging模块用法简单示例

    这篇文章主要介绍了Python 日志logging模块用法,结合简单实例形式分析了Python 日志logging模块功能、原理及日志输出到控制台与文件的相关操作技巧,需要的朋友可以参考下
    2019-10-10

最新评论