Python中的常见数据集打乱方法

更新时间：2023年02月02日 17:00:47 作者：starky0729

这篇文章主要介绍了Python中的常见数据集打乱方法，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教

python常见的数据集打乱方法

第一种方法

通过index

x_train, y_train=train_load()

index = [i for i in range(len(x_train))]

np.random.shuffle(index)

x_train= x_train[index]

y_train = y_train[index]

第二种方法

zip()+shuffle()方法

x_train, y_train=train_load()
result = list(zip(x_train, y_train))  # 打乱的索引序列
np.random.shuffle(result)
x_train,y_train = zip(*result)

第三种方法

seed()+shuffle

x_batch, y_batch = train_load()
#加载我所有的数据,这里想x_batch,Y_batch是list的格式,要注意

seed=100
random.seed(seed)
random.shuffle(x_batch)
random.seed(seed)#一定得重复在写一遍,和上面的seed要相同,不然y_batch和x_batch打乱顺序会不一样
random.shuffle(y_batch)

PS：numpy中函数shuffle与permutation都是对原来的数组随机打乱原来的顺序，shuffle中文含义为洗牌，permutation中文含义为排列，区别在于shuffle直接在原来的数组上进行操作，改变原来数组的顺序，无返回值。

而permutation不直接在原来的数组上进行操作，而是返回一个新的打乱顺序的数组，并不改变原来的数组。

python手动打乱数据集

x_train, y_train = np.array(x_train),np.array(y_train)
index = [i for i in range(len(y_train))]
np.random.shuffle(index)
x_train = x_train[index]
y_train = y_train[index]

总结

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

ubuntu 18.04 安装opencv3.4.5的教程(图解)
这篇文章主要介绍了ubuntu 18.04 安装opencv3.4.5的教程，本文图文并茂给大家介绍的非常详细，具有一定的参考借鉴价值,需要的朋友可以参考下
2019-11-11
详解python实现识别手写MNIST数字集的程序
这篇文章主要介绍了详解python实现识别手写MNIST数字集的程序，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-08-08
Python 数据可视化之Bokeh详解
这篇文章主要介绍了Python数据可视化库Bokeh的使用总结，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2021-11-11
padas 生成excel 增加sheet表的实例
今天小编就为大家分享一篇padas 生成excel 增加sheet表的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-12-12
python神经网络学习数据增强及预处理示例详解
这篇文章主要为大家介绍了python神经网络学习数据增强及预处理示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-05-05
Django开发中使用Ueditor上传图片遇到的坑及解决
在Django开发中使用Ueditor上传图片时,可能会遇到后端配置不正确的问题,建议在实例化Ueditor后加上serverUrl,这可以在Chrome的F12工具中查看请求的后端配置项,此外,如果需要修改上传路径,可以在配置文件中更改路径,并调整view.py中的代码来管理上传文件
2024-09-09
使用python实现kmean算法
这篇文章主要介绍了使用python实现kmean算法,kmean 是无监督学习的一种算法，主要是用来进行聚类分析的，他会在数据集中算出几个点作为簇中心，求这些数据集与这些簇中心的距离，并将距离同一个簇中心距离最近的数据归为一类,需要的朋友可以参考下
2023-04-04
pandas 时间偏移的实现
时间偏移就是在指定时间往前推或者往后推一段时间，即加减一段时间之后的时间，本文使用Python实现，感兴趣的可以了解一下
2021-08-08
详解Python之unittest单元测试代码
本篇文件主要介绍了详解Python之unittest测试代码，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-01-01
Python中排序函数sorted()函数的使用实例
sorted()作为Python内置函数之一,其功能是对序列（列表、元组、字典、集合、还包括字符串）进行排序,下面这篇文章主要给大家介绍了关于Python中排序函数sorted()函数的相关资料,需要的朋友可以参考下
2022-11-11