对python打乱数据集中X,y标签对的方法详解
今天踩过的两个小坑:
一.用random的shuffle打乱数据集中的数据-标签对
index=[i for i in range(len(X_batch))] # print(type(index)) index=random.shuffle(index)
结果shuffle完以后index变成None了,看了下api,这样说明的:
这个函数如果返回值,就返回None,所以用index=balabala就把index的内容改变了。去掉index=random.shuffle(index)等号前面的值,这样利用shuffle函数就可以直接将index的内容打乱,并且不返回任何值。
因此以上方式就可以打乱index的顺序,并以新顺序输出batch中的数据。
二.整体引用index这个list中的数据
因为index是一个list,所以代码这样写:
X_batch=X_batch[index] Y_batch=Y_batch[index]
是有问题的,报错是:TypeError: list indices must be integers or slices, not list.
这是因为我的X_batch,Y_batch都是list,直接引用index是错误的。而可以直接引用的方法是如果X_batch,Y_batch是数组,index是数组,就可以。
所以代码改成了:
X_batch,Y_batch=data_generator(data_path) index=[i for i in range(len(X_batch))] # print(type(index)) random.shuffle(index) index=np.array(index) X_batch=[np.array(X_batch)[index]] Y_batch=[np.array(Y_batch)[index]]
参考代码:
以上这篇对python打乱数据集中X,y标签对的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
Python中最好用的命令行参数解析工具(argparse)
这篇文章主要介绍了Python中最好用的命令行参数解析工具(argparse),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2019-08-08python通过paramiko复制远程文件及文件目录到本地
这篇文章主要为大家详细介绍了python通过paramiko复制远程文件及文件目录到本地,具有一定的参考价值,感兴趣的小伙伴们可以参考一下2019-04-04Opencv图像添加椒盐噪声、高斯滤波去除噪声原理以及手写Python代码实现方法
椒盐噪声的特征非常明显,为图像上有黑色和白色的点,下面这篇文章主要给大家介绍了关于Opencv图像添加椒盐噪声、高斯滤波去除噪声原理以及手写Python代码实现的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下2022-09-09
最新评论