浅谈Keras中shuffle和validation_split的顺序

 更新时间:2020年06月19日 09:37:19   作者:谢润忠  
这篇文章主要介绍了浅谈Keras中shuffle和validation_split的顺序,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

模型的fit函数有两个参数,shuffle用于将数据打乱,validation_split用于在没有提供验证集的时候,按一定比例从训练集中取出一部分作为验证集

这里有个陷阱是,程序是先执行validation_split,再执行shuffle的,所以会出现这种情况:

假如你的训练集是有序的,比方说正样本在前负样本在后,又设置了validation_split,那么你的验证集中很可能将全部是负样本

同样的,这个东西不会有任何错误报出来,因为Keras不可能知道你的数据有没有经过shuffle,保险起见如果你的数据是没shuffle过的,最好手动shuffle一下

补充知识:Keras使用陷阱

1 TF卷积核与TH卷积核

Keras提供了两套后端,Theano和Tensorflow。如果你从无到有搭建自己的一套网络,则大可放心。但如果你想使用一个已有网络,或把一个用th/tf 训练的网络以另一种后端应用,在载入的时候你就应该特别小心了。

卷积核与所使用的后端不匹配,不会报任何错误,因为它们的shape是完全一致的,没有方法能够检测出这种错误。

在使用预训练模型时,一个建议是首先找一些测试样本,看看模型的表现是否与预计的一致。

如需对卷积核进行转换,可以使用utils.convert_all_kernels_in_model对模型的所有卷积核进行转换

2 向BN层中载入权重

如果你不知道从哪里淘来一个预训练好的BN层,想把它的权重载入到Keras中,要小心参数的载入顺序。

一个典型的例子是,将caffe的BN层参数载入Keras中,caffe的BN由两部分构成,bn层的参数是mean,std,scale层的参数是gamma,beta。

按照BN的文章顺序,似乎载入Keras BN层的参数应该是[mean, std, gamma, beta];

然而不是的,Keras的BN层参数顺序应该是[gamma, beta, mean, std],这是因为gamma和beta是可训练的参数,而mean和std不是。Keras的可训练参数在前,不可训练参数在后

错误的权重顺序不会引起任何报错,因为它们的shape完全相同

3 shuffle和validation_split的顺序

模型的fit函数有两个参数,shuffle用于将数据打乱,validation_split用于在没有提供验证集的时候,按一定比例从训练集中取出一部分作为验证集.

这里有个陷阱是,程序是先执行validation_split,再执行shuffle的,所以会出现这种情况:

假如你的训练集是有序的,比方说正样本在前负样本在后,又设置了validation_split,那么你的验证集中很可能将全部是负样本。

同样的,这个东西不会有任何错误报出来,因为Keras不可能知道你的数据有没有经过shuffle,保险起见如果你的数据是没shuffle过的,最好手动shuffle一下。

4 Merge层的层对象与函数方法

Keras定义了一套用于融合张量的方法,位于keras.layers.Merge,里面有两套工具,以大写字母开头的是Keras Layer类,使用这种工具是需要实例化一个Layer对象,然后再使用。以小写字母开头的是张量函数方法,本质上是对Merge Layer对象的一个包装,但使用更加方便一些。注意辨析。

以上这篇浅谈Keras中shuffle和validation_split的顺序就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python通过zlib实现压缩与解压字符串的方法

    python通过zlib实现压缩与解压字符串的方法

    这篇文章主要介绍了python通过zlib实现压缩与解压字符串的方法,较为详细的介绍了zlib的用法及使用zlib.compressobj和zlib.decompressobj对文件进行压缩解压的方法,需要的朋友可以参考下
    2014-11-11
  • 使用 Celery Once 来防止 Celery 重复执行同一个任务

    使用 Celery Once 来防止 Celery 重复执行同一个任务

    这篇文章主要介绍了使用 Celery Once 来防止 Celery 重复执行同一个任务,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-10-10
  • django配置app中的静态文件步骤

    django配置app中的静态文件步骤

    这篇文章主要介绍了django配置app中的静态文件步骤,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • 基于Python编写一个根据姓名测性别的小程序

    基于Python编写一个根据姓名测性别的小程序

    这篇文章主要为大家介绍了如何利用Python编写一款根据中文名能猜测性别的一款界面化的小程序,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2022-03-03
  • Django web自定义通用权限控制实现方法

    Django web自定义通用权限控制实现方法

    这篇文章主要介绍了Django web自定义通用权限控制实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • python使用正则表达式替换匹配成功的组并输出替换的次数

    python使用正则表达式替换匹配成功的组并输出替换的次数

    正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。这篇文章主要介绍了python使用正则表达式替换匹配成功的组并输出替换的次数,需要的朋友可以参考下
    2017-11-11
  • python模块详解之pywin32使用文档(python操作windowsAPI)

    python模块详解之pywin32使用文档(python操作windowsAPI)

    pywin32是一个第三方模块库,主要的作用是方便python开发者快速调用windows API的一个模块库,这篇文章主要给大家介绍了关于python模块详解之pywin32使用文档的相关资料,文中将python操作windowsAPI介绍的非常详细,需要的朋友可以参考下
    2024-01-01
  • Python使用matplotlib实现的图像读取、切割裁剪功能示例

    Python使用matplotlib实现的图像读取、切割裁剪功能示例

    这篇文章主要介绍了Python使用matplotlib实现的图像读取、切割裁剪功能,结合实例形式分析了Python基于matplotlib操作图片的加载、读取、坐标控制及裁剪相关操作技巧,需要的朋友可以参考下
    2018-04-04
  • 详解Pycharm与anaconda安装配置指南

    详解Pycharm与anaconda安装配置指南

    这篇文章主要介绍了详解Pycharm与anaconda安装配置指南,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08
  • Python中datetime模块参考手册

    Python中datetime模块参考手册

    Python处理时间和日期方面的模块,主要就是datetime、time、calendar三个模块的使用。下面这篇文章主要给大家介绍的是Python中的datetime模块,需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-01-01

最新评论