python验证多组数据之间有无显著差异

更新时间：2022年01月02日 15:23:35 作者：fff2zrx

这篇文章主要介绍了python验证多组数据之间有无显著差异，利用方差分析和卡方分布验证多组数据之间的某些属性有无显著性差异，对于连续性属性可以用方差分析，对于离散型属性可以用卡方检验。下面文章详细内容需要的小伙伴可以参考一下

一、方差分析

1.单因素方差分析

通过箱线图可以人肉看出10组的订单量看起来差不多，为了更科学比较10组的订单量有无显著差异，我们可以利用方差分析

from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
model = ols('orders~C(label)',data=need_data).fit()
anova_table = anova_lm(model, typ = 2)
print(anova_table)

结果显示，p值为0.62大于0.05，不能拒绝原假设，所以这10组的订单量分布没有显著差异。

二、卡方检验

如果是比较多组之间的非连续值指标是否存在差异呢？

如检查上面10组的男女比例是否存在显著差异

计算各组观察频数：

data2=data1.melt(id_vars=['性别'],value_name='观察频数')
data2.head()

计算总体的男女比例：

rate=(data2.groupby(['性别'])['观察频数'].sum()/data2.groupby(['性别'])['观察频数'].sum().sum()).reset_index()
rate.columns=['性别','rate']
rate

计算各组用户总数：

group_sum=data2.groupby(['组别'])['观察频数'].sum().reset_index()
group_sum.columns=['组别','组内用户数']
group_sum

计算卡方值：

import math
data3=pd.merge(data2,group_sum,on=['组别'],how='left')
data3=pd.merge(data3,rate,on=['性别'],how='left')
data3['期望频数']=data3['组内用户数']*data3['rate']
data3['卡方值']=data3.apply(lambda x: math.pow((x.期望频数-x.观察频数),2)/x.期望频数,axis=1)
data3.head()

本案例的自由度为(10-1)*(2-1)=9,选取显著性水平为0.05，查卡方分布表得临界值为18.31
因为7.01<18.31,所以不能拒绝原假设，即各组的性别分布不存在显著性差异。

到此这篇关于python验证多组数据之间有无显著差异的文章就介绍到这了,更多相关python验证多组数据之间有无显著差异内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python 实现以相同规律打乱多组数据

Python实现带参数与不带参数的多重继承示例
这篇文章主要介绍了Python实现带参数与不带参数的多重继承,结合具体实例形式对比分析了Python实现带参数与不带参数的多重继承相关操作技巧,需要的朋友可以参考下
2018-01-01
Pandas 内置的十种画图方法
这篇文章主要介绍了Pandas 内置的十种画图方法，Pandas是非常常见的数据分析工具，我们一般都会处理好处理数据然后使用searbon或matplotlib来进行绘制
2022-09-09
python 通过手机号识别出对应的微信性别(实例代码)
这篇文章主要介绍了python 通过手机号识别出对应的微信性别，本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下
2019-12-12
Python机器学习之AdaBoost算法
今天带大家来学习Python机器学习,文中对AdaBoost算法介绍的很详细,有非常多的代码示例,对正在学习python的小伙伴们有很好地帮助,需要的朋友可以参考下
2021-05-05
python实现连续图文识别
这篇文章主要为大家详细介绍了python实现连续图文识别功能，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-12-12
使用Python中的Playwright制作测试视频的实现步骤
Playwright 是一种流行的用于测试 Web 应用程序的自动化工具,它提供了多种功能来使测试更加高效和可靠,这些功能之一是能够捕获测试运行的视频,在此博客中,田辛老师将探索如何使用 Python 中的 Playwright 制作测试视频,感兴趣的同学可以参考本文自己动手尝试
2023-10-10
详解Django中 render() 函数的使用方法
这篇文章主要介绍了Django中 render() 函数的使用方法,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-04-04
python wxpython 实现界面跳转功能
wxpython没提供界面跳转的方式，所以就需要借助threading模块，本文给大家分享python wxpython 实现界面跳转功能，感兴趣的朋友跟随小编一起看看吧
2019-12-12
pandas归一化与反归一化操作实现
本文主要介绍了pandas归一化与反归一化操作实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-01-01
Python 并列和或者条件的使用说明
这篇文章主要介绍了Python 并列和或者条件的使用说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-03-03