Pandas数据离散化原理及实例解析

 更新时间:2019年11月16日 12:03:45   作者:太虚真人  
这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 推荐一款高效的python数据框处理工具Sidetable

    推荐一款高效的python数据框处理工具Sidetable

    这篇文章主要为大家介绍推荐一款高效的python数据框处理工具Sidetable,文章详细的讲解了Sidetable的安装及用法,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-11-11
  • 用Python解析身份证号获取年龄和性别的实现方法

    用Python解析身份证号获取年龄和性别的实现方法

    身份证号码包含了丰富的信息,包括生日和性别,Python提供了处理和解析身份证号的功能,让我们能够从中提取出相关的信息,本文将介绍如何利用Python解析身份证号,获取持有者的年龄和性别信息,感兴趣的朋友可以参考下
    2023-12-12
  • Pytorch中.new()的作用详解

    Pytorch中.new()的作用详解

    今天小编就为大家分享一篇Pytorch中.new()的作用详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • 关于Gradio中Button用法及事件监听器click方法使用

    关于Gradio中Button用法及事件监听器click方法使用

    介绍了在Gradio中使用Button组件和事件监听器的click方法,通过一个简单的示例展示了如何实现点击按钮输出一行文字的功能,在实际项目中遇到了一个错误,经过排查和请教室友后,发现问题出在inputs参数的传递上,需要传入一个包含输入组件的列表
    2024-11-11
  • 基于Python编写一个语音合成系统

    基于Python编写一个语音合成系统

    这篇文章主要介绍了如何利用Python制作一个语音合成系统,文中的示例代码讲解详细,对我们学习Python有一定的帮助,感兴趣的小伙伴可以了解一下
    2022-03-03
  • Python解析微信dat文件的方法

    Python解析微信dat文件的方法

    这篇文章主要介绍了Python解析微信dat文件的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • Python利用pyecharts实现数据可视化的示例代码

    Python利用pyecharts实现数据可视化的示例代码

    Pyecharts是一个用于生成 Echarts 图表的 Python 库,Echarts 是一个由百度开源的数据可视化工具,它提供的图表种类丰富,交互性强,兼容性好,非常适合用于数据分析结果的展示,本文将给大家介绍Python利用pyecharts实现数据可视化,需要的朋友可以参考下
    2024-09-09
  • 利用Python实现朋友圈中的九宫格图片效果

    利用Python实现朋友圈中的九宫格图片效果

    这篇文章主要给大家介绍了关于利用Python如何实现朋友圈中九宫格图片效果的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • conda查看、创建、删除、激活与退出环境命令详解

    conda查看、创建、删除、激活与退出环境命令详解

    在不同的项目中经常需要conda来配置环境,这样能够实现不同版本的python和库的随意切换,并且减少了很多不必要的麻烦,下面这篇文章主要给大家介绍了关于conda查看、创建、删除、激活与退出环境命令的相关资料,需要的朋友可以参考下
    2023-05-05
  • PyQtGraph在pyqt中的应用及安装过程

    PyQtGraph在pyqt中的应用及安装过程

    这篇文章主要介绍了PyQtGraph在pyqt中的应用,文中给大家介绍了pyqtgraph的主要用途及PyQtGraph的安装过程,需要的朋友可以参考下
    2019-08-08

最新评论