pandas数据处理之标签列字符转数字的实现

更新时间：2021年03月18日 11:14:34 作者：wx740851326

这篇文章主要介绍了pandas数据处理之标签列字符转数字的实现方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

机器学习中，当我们在进行数据预处理的时候，对于标签列非字符的数据，我们往往需要将其转换成字符，因为有的算法可能不支持非数字类型来做特征。

那么怎么快捷地来着这个转换呢，请看我的示例：

1.构建测试数据

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.数据转换下，并获取标签列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函数进行转换

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

这样，就将标签列处理好了哈

等用完之后，再转回来

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

补充：pandas factorize将字符串特征转化为数字特征

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

都是字符串特征,无法用于训练，当然可以单独建立map硬编码处理，但是pandas已经封装好了相应的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文章:

python函数的高级应用详解
这篇文章主要为大家介绍了python函数的高级应用，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助
2021-11-11
python实现会员信息管理系统(List)
这篇文章主要为大家详细介绍了python实现会员信息管理系统，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2022-03-03
利用Rust实现Python加速的技巧分享
这篇文章主要想来和大家一起探讨一下关于使用Rust对Python计算进行加速的问题,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
2023-09-09
详解Python中可散列的数据类型
在Python中，字典（dict）是一种常用的数据类型，其使用键（key）和值（value）来存储和访问数据，在字典中，键必须是可哈希（hashable）的类型，否则会导致运行时错误，因此，在Python中，有一些可散列的数据类型可以作为字典的键
2023-06-06
numpy 对矩阵中Nan的处理:采用平均值的方法
今天小编就为大家分享一篇numpy 对矩阵中Nan的处理:采用平均值的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-10-10
python pandas遍历每行并累加进行条件过滤方式
这篇文章主要介绍了python pandas遍历每行并累加进行条件过滤方式，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-05-05
Python importlib动态导入模块实现代码
这篇文章主要介绍了Python importlib动态导入模块实现代码,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-04-04
python生成多个只含0,1元素的随机数组或列表的实例
今天小编就为大家分享一篇python生成多个只含0,1元素的随机数组或列表的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-11-11
pandas中ix的使用详细讲解
这篇文章主要介绍了pandas中ix的使用详细讲解，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-03-03
python-opencv 中值滤波{cv2.medianBlur(src, ksize)}的用法
这篇文章主要介绍了python-opencv 中值滤波{cv2.medianBlur(src, ksize)}的用法，具有很好的参考价值，希望对大家有所帮助。
2021-06-06