python之tensorflow手把手实例讲解猫狗识别实现

 更新时间:2021年09月22日 16:03:07   作者:鑫xing  
要说到深度学习图像分类的经典案例之一,那就是猫狗大战了。猫和狗在外观上的差别还是挺明显的,无论是体型、四肢、脸庞和毛发等等, 都是能通过肉眼很容易区分的。那么如何让机器来识别猫和狗呢?网上已经有不少人写过这案例了,我也来尝试下练练手。

作为tensorflow初学的大三学生,本次课程作业的使用猫狗数据集做一个二分类模型。

一,猫狗数据集数目构成

train cats:1000 ,dogs:1000
test cats: 500,dogs:500
validation cats:500,dogs:500

二,数据导入

train_dir = 'Data/train'
test_dir = 'Data/test'
validation_dir = 'Data/validation'
train_datagen = ImageDataGenerator(rescale=1/255,
                                   rotation_range=10,
                                   width_shift_range=0.2,  #图片水平偏移的角度
                                   height_shift_range=0.2,  #图片数值偏移的角度
                                   shear_range=0.2,  #剪切强度 
                                   zoom_range=0.2,   #随机缩放的幅度
                                   horizontal_flip=True,   #是否进行随机水平翻转
#                                    fill_mode='nearest'
                                  )
train_generator = train_datagen.flow_from_directory(train_dir,
                 (224,224),batch_size=1,class_mode='binary',shuffle=False)
test_datagen = ImageDataGenerator(rescale=1/255)
test_generator = test_datagen.flow_from_directory(test_dir,
                 (224,224),batch_size=1,class_mode='binary',shuffle=True)
validation_datagen = ImageDataGenerator(rescale=1/255)
validation_generator = validation_datagen.flow_from_directory(
                validation_dir,(224,224),batch_size=1,class_mode='binary')
print(train_datagen)
print(test_datagen)
print(train_datagen)

三,数据集构建

我这里是将ImageDataGenerator类里的数据提取出来,将数据与标签分别存放在两个列表,后面在转为np.array,也可以使用model.fit_generator,我将数据放在内存为了后续调参数时模型训练能更快读取到数据,不用每次训练一整轮都去读一次数据(应该是这样的…我是这样理解…)
注意我这里的数据集构建后,三种数据都是存放在内存中的,我电脑内存是16g的可以存放下。

train_data=[]
train_labels=[]
a=0
for data_train, labels_train in train_generator:
    train_data.append(data_train)
    train_labels.append(labels_train)
    a=a+1
    if a>1999:
        break
x_train=np.array(train_data)
y_train=np.array(train_labels)
x_train=x_train.reshape(2000,224,224,3)
test_data=[]
test_labels=[]
a=0
for data_test, labels_test in test_generator:
    test_data.append(data_test)
    test_labels.append(labels_test)
    a=a+1
    if a>999:
        break
x_test=np.array(test_data)
y_test=np.array(test_labels)
x_test=x_test.reshape(1000,224,224,3)
validation_data=[]
validation_labels=[]
a=0
for data_validation, labels_validation in validation_generator:
    validation_data.append(data_validation)
    validation_labels.append(labels_validation)
    a=a+1
    if a>999:
        break
x_validation=np.array(validation_data)
y_validation=np.array(validation_labels)
x_validation=x_validation.reshape(1000,224,224,3)

四,模型搭建

model1 = tf.keras.models.Sequential([
    # 第一层卷积,卷积核为,共16个,输入为150*150*1
    tf.keras.layers.Conv2D(16,(3,3),activation='relu',padding='same',input_shape=(224,224,3)),
    tf.keras.layers.MaxPooling2D((2,2)),
    
    # 第二层卷积,卷积核为3*3,共32个,
    tf.keras.layers.Conv2D(32,(3,3),activation='relu',padding='same'),
    tf.keras.layers.MaxPooling2D((2,2)),
    
    # 第三层卷积,卷积核为3*3,共64个,
    tf.keras.layers.Conv2D(64,(3,3),activation='relu',padding='same'),
    tf.keras.layers.MaxPooling2D((2,2)),
    
    # 数据铺平
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64,activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(1,activation='sigmoid')
])
print(model1.summary())

模型summary:

在这里插入图片描述

五,模型训练

model1.compile(optimize=tf.keras.optimizers.SGD(0.00001),
             loss=tf.keras.losses.binary_crossentropy,
             metrics=['acc'])
history1=model1.fit(x_train,y_train,
# 					validation_split=(0~1)   选择一定的比例用于验证集,可被validation_data覆盖
                  validation_data=(x_validation,y_validation),
                  batch_size=10,
                  shuffle=True,
                  epochs=10)
model1.save('cats_and_dogs_plain1.h5')
print(history1)

在这里插入图片描述

plt.plot(history1.epoch,history1.history.get('acc'),label='acc')
plt.plot(history1.epoch,history1.history.get('val_acc'),label='val_acc')
plt.title('正确率')
plt.legend()

在这里插入图片描述

可以看到我们的模型泛化能力还是有点差,测试集的acc能达到0.85以上,验证集却在0.65~0.70之前跳动。

六,模型测试

model1.evaluate(x_validation,y_validation)

在这里插入图片描述

最后我们的模型在测试集上的正确率为0.67,可以说还不够好,有点过拟合,可能是训练数据不够多,后续可以数据增广或者从验证集、测试集中调取一部分数据用于训练模型,可能效果好一些。

到此这篇关于python之tensorflow手把手实例讲解猫狗识别实现的文章就介绍到这了,更多相关python tensorflow 猫狗识别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Pandas将列表(List)转换为数据框(Dataframe)

    Pandas将列表(List)转换为数据框(Dataframe)

    这篇文章主要介绍了Pandas将列表(List)转换为数据框(Dataframe),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-04-04
  • Python多线程与异步处理在HTTP请求中的应用方式

    Python多线程与异步处理在HTTP请求中的应用方式

    这篇文章主要介绍了Python多线程与异步处理在HTTP请求中的应用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • 基于sklearn实现Bagging算法(python)

    基于sklearn实现Bagging算法(python)

    这篇文章主要为大家详细介绍了基于sklearn实现Bagging算法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-07-07
  • python绘图方法实例入门

    python绘图方法实例入门

    这篇文章主要介绍了python绘图方法,实例分析了Python的绘图技巧,涉及Python中matplotlib模块的使用方法,需要的朋友可以参考下
    2015-05-05
  • Python Pygame实现兔子猎人守护城堡游戏

    Python Pygame实现兔子猎人守护城堡游戏

    这篇文章主要介绍了用python来制作的一个守护类小游戏兔子猎人守护城堡,文中的示例代码介绍得很详细,感兴趣的小伙伴快来跟随小编一起学习学习吧
    2021-12-12
  • Python如何求取逆序数

    Python如何求取逆序数

    这篇文章主要介绍了Python如何求取逆序数问题,具有很好的参考价值,希望大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-12-12
  • python3.5 cv2 获取视频特定帧生成jpg图片

    python3.5 cv2 获取视频特定帧生成jpg图片

    这篇文章主要为大家详细介绍了python3.5 cv2 获取视频特定帧生成jpg图片,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • Django分页功能的实现代码详解

    Django分页功能的实现代码详解

    在本篇文章里小编给大家整理了关于Django分页功能的实现代码以及相关知识点内容,需要的朋友们可以跟着学习参考下。
    2019-07-07
  • 利用python实现终身免费的听书工具

    利用python实现终身免费的听书工具

    本文通过实际案例,详细介绍了作者如何利用Python库实现文本转语音的过程,从安装库到实际操作案例,都有详细的说明,为读者提供了一定的参考价值
    2024-03-03
  • Python中字典及遍历常用函数的使用详解

    Python中字典及遍历常用函数的使用详解

    这篇文章主要为大家介绍了Python中字典有关的常见函数的使用方法,以及字典遍历的方法。文中通过示例代码为我们进行了详细介绍,对学习Python字典有一定帮助,需要的可以参考一下
    2022-06-06

最新评论