关于Tensorflow中的tf.train.batch函数的使用

更新时间：2018年04月24日 13:55:11 作者：silence1214

本篇文章主要介绍了关于Tensorflow中的tf.train.batch函数的使用，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧

这两天一直在看tensorflow中的读取数据的队列，说实话，真的是很难懂。也可能我之前没这方面的经验吧，最早我都使用的theano，什么都是自己写。经过这两天的文档以及相关资料，并且请教了国内的师弟。今天算是有点小感受了。简单的说，就是计算图是从一个管道中读取数据的，录入管道是用的现成的方法，读取也是。为了保证多线程的时候从一个管道读取数据不会乱吧，所以这种时候读取的时候需要线程管理的相关操作。今天我实验室了一个简单的操作，就是给一个有序的数据，看看读出来是不是有序的，结果发现是有序的，所以直接给代码：

import tensorflow as tf
import numpy as np

def generate_data():
  num = 25
  label = np.asarray(range(0, num))
  images = np.random.random([num, 5, 5, 3])
  print('label size :{}, image size {}'.format(label.shape, images.shape))
  return label, images

def get_batch_data():
  label, images = generate_data()
  images = tf.cast(images, tf.float32)
  label = tf.cast(label, tf.int32)
  input_queue = tf.train.slice_input_producer([images, label], shuffle=False)
  image_batch, label_batch = tf.train.batch(input_queue, batch_size=10, num_threads=1, capacity=64)
  return image_batch, label_batch

image_batch, label_batch = get_batch_data()
with tf.Session() as sess:
  coord = tf.train.Coordinator()
  threads = tf.train.start_queue_runners(sess, coord)
  i = 0
  try:
    while not coord.should_stop():
      image_batch_v, label_batch_v = sess.run([image_batch, label_batch])
      i += 1
      for j in range(10):
        print(image_batch_v.shape, label_batch_v[j])
  except tf.errors.OutOfRangeError:
    print("done")
  finally:
    coord.request_stop()
  coord.join(threads)

记得那个slice_input_producer方法，默认是要shuffle的哈。

Besides, I would like to comment this code.

1: there is a parameter ‘num_epochs' in slice_input_producer, which controls how many epochs the slice_input_producer method would work. when this method runs the specified epochs, it would report the OutOfRangeRrror. I think it would be useful for our control the training epochs.

2: the output of this method is one single image, we could operate this single image with tensorflow API, such as normalization, crops, and so on, then this single image is feed to batch method, a batch of images for training or testing wouldbe received.

tf.train.batch和tf.train.shuffle_batch的区别用法

tf.train.batch([example, label], batch_size=batch_size, capacity=capacity)：[example, label]表示样本和样本标签，这个可以是一个样本和一个样本标签，batch_size是返回的一个batch样本集的样本个数。capacity是队列中的容量。这主要是按顺序组合成一个batch

tf.train.shuffle_batch([example, label], batch_size=batch_size, capacity=capacity, min_after_dequeue)。这里面的参数和上面的一样的意思。不一样的是这个参数min_after_dequeue，一定要保证这参数小于capacity参数的值，否则会出错。这个代表队列中的元素大于它的时候就输出乱的顺序的batch。也就是说这个函数的输出结果是一个乱序的样本排列的batch，不是按照顺序排列的。

上面的函数返回值都是一个batch的样本和样本标签，只是一个是按照顺序，另外一个是随机的

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

Python轻量级ORM框架Peewee访问sqlite数据库的方法详解
这篇文章主要介绍了Python轻量级ORM框架Peewee访问sqlite数据库的方法,结合实例形式较为详细的分析了ORM框架的概念、功能及peewee的安装、使用及操作sqlite数据库的方法,需要的朋友可以参考下
2017-07-07
Python pandas 计算每行的增长率与累计增长率
这篇文章主要介绍了Python pandas 计算每行的增长率与累计增长率，文章举例详细说明。需要的小伙伴可以参考一下
2022-03-03
深入学习Python可变与不可变对象操作实例
Python中的数据类型可以分为可变对象和不可变对象,了解它们之间的区别对于编写高效的Python代码至关重要,本文将详细介绍可变对象和不可变对象的概念,以及如何正确地使用它们来提高代码的性能和可读性
2023-12-12
亲手教你用Python打造一款摸鱼倒计时界面
前段时间在微博看到一段摸鱼人的倒计时模板，感觉很有意思，于是我用了一个小时的时间写一个页面出来，下面小编把实现过程分享给大家，对Python摸鱼倒计时界面感兴趣的朋友一起看看吧
2021-12-12
Python使用当前时间、随机数产生一个唯一数字的方法
这篇文章主要介绍了Python使用当前时间、随机数产生一个唯一数字的方法,涉及Python时间与随机数相关操作技巧,需要的朋友可以参考下
2017-09-09
解决python中的幂函数、指数函数问题
今天小编就为大家分享一篇解决python中的幂函数、指数函数问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-11-11
OpenCV 边缘检测
OpenCV提供了许多边缘检测滤波函数，这些滤波函数都会将非边缘区域转为黑色，将边缘区域转为白色或其他饱和的颜色。这篇文章主要介绍了OpenCV 边缘检测,需要的朋友可以参考下
2019-07-07
Pycharm如何设置默认请求头和切换python环境
这篇文章主要介绍了Pycharm如何设置默认请求头和切换python环境问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-06-06
python三大器之迭代器、生成器、装饰器
迭代是Python最强大的功能之一，是访问集合元素的一种方式；迭代器是一个可以记住遍历的位置的对象，本文给大家介绍python三大器之迭代器、生成器、装饰器的相关知识，感兴趣的朋友跟随小编一起看看吧
2022-01-01
Python双端队列实现回文检测
双端队列 Deque 是一种有次序的数据集，跟队列相似，其两端可以称作"首" 和 "尾"端。这篇文章将通过双端队列实现回文检测，感兴趣的可以学习一下
2022-01-01

关于Tensorflow中的tf.train.batch函数的使用

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具