pandas使用get_dummies进行one-hot编码的方法

 更新时间:2018年07月10日 10:21:23   作者:BYR_jiandong  
今天小编就为大家分享一篇pandas使用get_dummies进行one-hot编码的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:

相关文章

  • 基于Python实现烟花效果的示例代码

    基于Python实现烟花效果的示例代码

    这篇文章主要为大家详细介绍了如何利用Python制作出烟花的效果,文中的示例代码讲解详细,对我们学习Python有一定帮助,需要的可以参考一下
    2022-06-06
  • 详解python实现邮件解析的方法

    详解python实现邮件解析的方法

    这篇文章主要为大家介绍了python实现邮件解析的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • python 实现按对象传值

    python 实现按对象传值

    今天小编就为大家分享一篇python 实现按对象传值,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • Python 图片视频模糊化实现案例

    Python 图片视频模糊化实现案例

    本文主要分享一个可以将图片或者视频模糊化的工具代码。技术路线主要是使用ffmpeg滤镜。感兴趣的小伙伴可以看一看
    2021-11-11
  • python卸载numpy出现WinError:拒绝访问的解决方案

    python卸载numpy出现WinError:拒绝访问的解决方案

    这篇文章主要介绍了python卸载numpy出现WinError:拒绝访问的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • Django框架基础模板标签与filter使用方法详解

    Django框架基础模板标签与filter使用方法详解

    这篇文章主要介绍了Django框架基础模板标签与filter使用方法,简单分析了Django模板基本语法、函数与自定义filter相关使用技巧,需要的朋友可以参考下
    2019-07-07
  • python 调用Google翻译接口的方法

    python 调用Google翻译接口的方法

    这篇文章主要介绍了python 调用Google翻译接口的方法,帮助大家更好的理解和使用python处理url,感兴趣的朋友可以了解下
    2020-12-12
  • 在脚本中单独使用django的ORM模型详解

    在脚本中单独使用django的ORM模型详解

    这篇文章主要介绍了在脚本中单独使用django的ORM模型详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • pytorch实现逻辑回归

    pytorch实现逻辑回归

    这篇文章主要为大家详细介绍了pytorch实现逻辑回归,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-04-04
  • 如何使用 Python 中的功能和库创建 n-gram

    如何使用 Python 中的功能和库创建 n-gram

    在计算语言学中,n-gram 对于语言处理、上下文和语义分析非常重要,它们是从令牌字符串中相邻的连续单词序列,本文将讨论如何使用 Python 中的功能和库创建 n-gram,感兴趣的朋友一起看看吧
    2023-09-09

最新评论