python Sweetviz探索性数据可视化分析库使用特征详解

更新时间：2024年01月30日 10:15:26 作者：程序员小寒

这篇文章主要为大家介绍了python Sweetviz探索性数据可视化分析库特征使用详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

python Sweetviz库

今天给大家分享一个神奇的 python 库，Sweetviz。

https://github.com/fbdesignpro/sweetviz

探索性数据分析是一个我们倾向于使用可视化方法来分析数据集并总结数据集主要特征的过程。

EDA 非常重要，因为如果你不熟悉正在处理的数据集，那么你将无法从该数据中推断出某些内容。然而，EDA通常需要花费大量时间。

但是，如果我告诉你 python 可以在一些库的帮助下自动化 EDA 过程呢？

在本文中，我们将使用 「Sweetviz」 实现 EDA 自动化。

它是一个 Python 库，可以生成「漂亮的高密度可视化」效果，从而通过一行代码启动 EDA（探索性数据分析）。输出是一个完全独立的 HTML 应用程序。

该系统是围绕快速可视化目标值和比较数据集而构建的。其目标是帮助快速分析目标特征、训练与测试数据以及其他此类数据表征任务。

安装库

与任何其他 python 库一样，我们可以使用下面给出的 pip install 命令来安装 sweetviz。

pip install sweetviz

分析数据集

让我们使用来自 Kaggle 的鸢尾花数据集。

你可以从此处下载数据集文件 ( https://www.kaggle.com/arshid/iris-flower-dataset)

# Import sweetviz and pandas libraries
import sweetviz as sv
import pandas as pd
# Now read the dataset using pd.read_csv() function
data = pd.read_csv('IRIS.csv')
# Split first 125 entries/rows into train data frame
train = data.iloc[:125]
# Split next rows from 125 until end into test data frame
test = data.iloc[125:]

现在你可以使用 show_html() 方法将数据框的分析结果显示为 HTML 文件。

report=sv.analyze(train)
report.show_html()

现在，如果你想比较两个数据帧（即训练集、测试集）之间的分析，你可以使用 sweetviz 库中的 compare() 函数。

compare_report=sv.compare(train,test)

compare_report.show_html()

如果你想比较两个子群体之间的分析，那么你可以使用 sweetviz 库中的 compare_intra() 函数。

请注意，在内部，这会创建 2 个单独的数据框来表示每个结果组。

compare_intra_report=sv.compare_intra(train,train['species']=='Iris-setosa',['setosa','other'])

compare_intra_report.show_html()

更多的功能期待大家去尝试，以上就是python Sweetviz探索性数据可视化分析库使用特征详解的详细内容，更多关于python Sweetviz库的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

举例讲解Python中的list列表数据结构用法
这篇文章主要介绍了Python中的list列表数据结构用法,列表是Python内置的六种集合类数据类型中最常见的之一,需要的朋友可以参考下
2016-03-03
Python数据类型之Set集合实例详解
这篇文章主要介绍了Python数据类型之Set集合,结合实例形式详细分析了Python数据类型中集合的概念、原理、创建、遍历、交集、并集等相关操作技巧,需要的朋友可以参考下
2019-05-05
分步骤教你用python一步步提取PPT中的图片
今天要带大家实现的是PPT图片的提取。在我们学习工作中，PPT的使用还是非常频繁的，但是自己做PPT是很麻烦的，所以就需要用到别人的模板或者素材，这个时候提取PPT图片就可以减少我们很多工作。
2021-09-09
对Python中列表和数组的赋值,浅拷贝和深拷贝的实例讲解
今天小编就为大家分享一篇对Python中列表和数组的赋值,浅拷贝和深拷贝的实例讲解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
Python3.4学习笔记之类型判断，异常处理，终止程序操作小结
这篇文章主要介绍了Python3.4学习笔记之类型判断，异常处理，终止程序操作,结合具体实例形式分析了Python3.4模块导入、异常处理、退出程序等相关操作技巧与注意事项,需要的朋友可以参考下
2019-03-03
Python中sys.stdout方法的语法示例详解
Python中sys 模块中的一个方法是stdout ,它使用其参数直接显示在控制台窗口上,print() 方法,它有相同的行为,首先转换为sys.stdout() 方法,然后在控制台显示结果,本文给大家介绍Python sys.stdout方法的语法,感兴趣的朋友一起看看吧
2023-09-09
python实现K最近邻算法
这篇文章主要为大家详细介绍了python实现K最近邻算法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-01-01
Tensorflow 定义变量,函数,数值计算等名字的更新方式
今天小编就为大家分享一篇Tensorflow 定义变量,函数,数值计算等名字的更新方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-02-02
python购物车程序简单代码
这篇文章主要为大家详细介绍了python购物车程序的简单代码，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-04-04
使用pycharm进行绘图,图片无法显示的解决
这篇文章主要介绍了使用pycharm进行绘图,图片无法显示的解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-07-07