Python中的常见数据集打乱方法

 更新时间:2023年02月02日 17:00:47   作者:starky0729  
这篇文章主要介绍了Python中的常见数据集打乱方法,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

python常见的数据集打乱方法

第一种方法

通过index 

x_train, y_train=train_load()

index = [i for i in range(len(x_train))]

np.random.shuffle(index)

x_train= x_train[index]

y_train = y_train[index]

第二种方法

zip()+shuffle()方法

x_train, y_train=train_load()
result = list(zip(x_train, y_train))  # 打乱的索引序列
np.random.shuffle(result)
x_train,y_train = zip(*result)

第三种方法

seed()+shuffle

x_batch, y_batch = train_load()
#加载我所有的数据,这里想x_batch,Y_batch是list的格式,要注意

seed=100
random.seed(seed)
random.shuffle(x_batch)
random.seed(seed)#一定得重复在写一遍,和上面的seed要相同,不然y_batch和x_batch打乱顺序会不一样
random.shuffle(y_batch)

PS:numpy中函数shuffle与permutation都是对原来的数组随机打乱原来的顺序,shuffle中文含义为洗牌,permutation中文含义为排列,区别在于shuffle直接在原来的数组上进行操作,改变原来数组的顺序,无返回值。

而permutation不直接在原来的数组上进行操作,而是返回一个新的打乱顺序的数组,并不改变原来的数组。

python手动打乱数据集

x_train, y_train = np.array(x_train),np.array(y_train)
index = [i for i in range(len(y_train))]
np.random.shuffle(index)
x_train = x_train[index]
y_train = y_train[index]

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • ubuntu 18.04 安装opencv3.4.5的教程(图解)

    ubuntu 18.04 安装opencv3.4.5的教程(图解)

    这篇文章主要介绍了ubuntu 18.04 安装opencv3.4.5的教程,本文图文并茂给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-11-11
  • 详解python实现识别手写MNIST数字集的程序

    详解python实现识别手写MNIST数字集的程序

    这篇文章主要介绍了详解python实现识别手写MNIST数字集的程序,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-08-08
  • Python 数据可视化之Bokeh详解

    Python 数据可视化之Bokeh详解

    这篇文章主要介绍了Python数据可视化库Bokeh的使用总结,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2021-11-11
  • padas 生成excel 增加sheet表的实例

    padas 生成excel 增加sheet表的实例

    今天小编就为大家分享一篇padas 生成excel 增加sheet表的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • python神经网络学习数据增强及预处理示例详解

    python神经网络学习数据增强及预处理示例详解

    这篇文章主要为大家介绍了python神经网络学习数据增强及预处理示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • Django开发中使用Ueditor上传图片遇到的坑及解决

    Django开发中使用Ueditor上传图片遇到的坑及解决

    在Django开发中使用Ueditor上传图片时,可能会遇到后端配置不正确的问题,建议在实例化Ueditor后加上serverUrl,这可以在Chrome的F12工具中查看请求的后端配置项,此外,如果需要修改上传路径,可以在配置文件中更改路径,并调整view.py中的代码来管理上传文件
    2024-09-09
  • 使用python实现kmean算法

    使用python实现kmean算法

    这篇文章主要介绍了使用python实现kmean算法,kmean 是无监督学习的一种算法,主要是用来进行聚类分析的,他会在数据集中算出几个点作为簇中心,求这些数据集与这些簇中心的距离,并将距离同一个簇中心距离最近的数据归为一类,需要的朋友可以参考下
    2023-04-04
  • pandas 时间偏移的实现

    pandas 时间偏移的实现

    时间偏移就是在指定时间往前推或者往后推一段时间,即加减一段时间之后的时间,本文使用Python实现,感兴趣的可以了解一下
    2021-08-08
  • 详解Python之unittest单元测试代码

    详解Python之unittest单元测试代码

    本篇文件主要介绍了详解Python之unittest测试代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-01-01
  • Python中排序函数sorted()函数的使用实例

    Python中排序函数sorted()函数的使用实例

    sorted()作为Python内置函数之一,其功能是对序列(列表、元组、字典、集合、还包括字符串)进行排序,下面这篇文章主要给大家介绍了关于Python中排序函数sorted()函数的相关资料,需要的朋友可以参考下
    2022-11-11

最新评论