关于数据分析之滚动窗口pandas.DataFrame.rolling方法

 更新时间:2024年09月10日 09:25:43   作者:Efred.D  
Pandas库中的rolling方法是数据处理中常用的功能,它允许用户对数据进行滚动窗口(滑动窗口)操作,通过指定窗口大小,可以使用不同的聚合函数对窗口内的数据进行计算,例如最大值、最小值、平均值、中位数等,此外,rolling方法还可以计算方差、标准差、偏度、峰度

本文使用pandas 1.3.5 , python 3, numpy 1.22.0库

前言

pandas.DataFrame.rolling方法就是SQL中的 group by方法

唯一一点区别就是rolling方法的分组不是一成不变的

而是随着窗口的移动而不停更新新的分组

rolling使用公式

pandas.DataFrame.rolling(window = ).聚合函数

【注:rolling方法是向前取数据!!!】

聚合函数总结如下:

  • max 最大值
  • min 最小值
  • mean 平均值
  • median 中位数
  • sum 求和
  • var 方差
  • std 标准差
  • skew 三阶矩(又叫偏度,用于描述一组数据分布的对称性)
  • kurt 四截距 (又叫峰度, 用于描述一组数据在均值附近分布的集中度)
  • cov 协方差
  • corr 相关系数(对不同单位敏感性强;通常使用pearson相关系数,该系数对不同单位脱敏)
  • quantile 百分数

【注:scipy.stats的skew和kurtosis方法和 pandas中的skew和kurt方法计算算法不同】

python实现

比如,我想分别以2和4为滑动窗口,计算dataFrame格式数据“C”列的和,并分别以“D”和 “E”命名

代码如下,

import pandas as pd
import numpy as np
np.random.seed(0)
date_DataFrame1 = pd.DataFrame(np.random.randn(10,3), index = pd.date_range("2020-05-01", periods = 10), columns = ["A","B","C"])
date_DataFrame1["D"] = date_DataFrame1["C"].rolling(window = 2).sum()
date_DataFrame1["E"] = date_DataFrame1["C"].rolling(window = 4).sum()

结果如下,

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python开发利器之ulipad的使用实践

    python开发利器之ulipad的使用实践

    Ulipad是一个国人limodou编写的专业Python编辑器,它基于wxpython开发的GUI(图形化界面)。下面这篇文章主要介绍了python开发利器之ulipad的使用实践,文中介绍的非常详细,对大家具有一定的参考价值,需要的朋友们下面来一起看看吧。
    2017-03-03
  • 详解Python中的Cookie模块使用

    详解Python中的Cookie模块使用

    这篇文章主要介绍了详解Python中的Cookie模块使用,是Python入门学习中的基础知识,需要的朋友可以参考下
    2015-07-07
  • Python列表中存放字典遇到的问题及处理

    Python列表中存放字典遇到的问题及处理

    这篇文章主要介绍了Python列表中存放字典遇到的问题及处理,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02
  • python神经网络MobileNetV2模型的复现详解

    python神经网络MobileNetV2模型的复现详解

    这篇文章主要为大家介绍了python神经网络MobileNetV2模型的复现详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • 用Python进行一些简单的自然语言处理的教程

    用Python进行一些简单的自然语言处理的教程

    这篇文章主要介绍了用Python进行一些简单的自然语言处理的教程,主要用到了pandas和collections库,需要的朋友可以参考下
    2015-03-03
  • python梯度下降法的简单示例

    python梯度下降法的简单示例

    这篇文章主要为大家详细介绍了Python梯度下降法的简单示例,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-08-08
  • pandas去除重复列的实现方法

    pandas去除重复列的实现方法

    这篇文章主要介绍了pandas去除重复列的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-01-01
  • python益智游戏计算汉诺塔问题示例

    python益智游戏计算汉诺塔问题示例

    汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具。
    2014-03-03
  • 对python中基于tcp协议的通信(数据传输)实例讲解

    对python中基于tcp协议的通信(数据传输)实例讲解

    今天小编就为大家分享一篇对python中基于tcp协议的通信(数据传输)实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python+Mysql实现登录注册完整代码示例

    Python+Mysql实现登录注册完整代码示例

    在开发中用户注册和登录是常见的功能需求,这篇文章主要给大家介绍了关于Python+Mysql实现登录注册的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-03-03

最新评论