基于pytorch实现对图片进行数据增强

更新时间：2024年01月05日 10:22:44 作者：草莓橙子碗

图像数据增强是一种在训练机器学习和深度学习模型时常用的策略,尤其是在计算机视觉领域,具体而言,它通过创建和原始图像稍有不同的新图像来扩大训练集,本文给大家介绍了如何基于pytorch实现对图片进行数据增强,需要的朋友可以参考下

背景

在进行机器学习的任务中，我们的训练数据往往是有限的，在有限的数据集上获得较好的模型训练结果，我们不仅要在模型结构上下功夫，另一方面也需要对数据集进行数据增强

图片数据增强

图像数据增强是一种在训练机器学习和深度学习模型时常用的策略，尤其是在计算机视觉领域。具体而言，它通过创建和原始图像稍有不同的新图像来扩大训练集。数据增强的主要目标有以下几点：

解决过拟合：过拟合是指模型在训练集上表现得过于优秀，但是在测试集（即未见过的新数据）上表现差的现象。一个常见的解决过拟合的策略是增加训练数据。数据增强通过在原有训练数据的基础上增加各种变化的数据，有效地增大了训练集。
提高模型的泛化能力：一些数据增强手段（如旋转、缩放、平移等）可以模拟一些真实场景中会产生的视觉变化，有助于训练模型对这些场景变化更具有鲁棒性，从而提高模型的泛化能力。
引入可控制的噪声：一些数据增强方法，如随机裁剪、像素值噪声、颜色偏移等，可以在一定程度上模拟真实环境中的噪声。以这样的方式引入的噪声可以使模型更健壮，并且增强模型的噪声容忍力。
视觉不变性：通过像翻转、旋转这样的变换，数据增强可以帮助模型在任何视觉角度下都能正确地识别出相同的对象，输入图像进行各种方式的扭曲后仍能被模型准确识别出来，增强了模型的视觉不变性。总的来说，图片数据增强可以让模型学习到更多样性的数据，可以在一定程度上提升模型的识别准确率，更好的适应实际环境中样本的多样性，从而提高模型的泛化能力。

代码实现

我们使用torchvision的transforms库对图片数据进行数据增强，使用一张卡比巴拉的图片

首先读取图片数据，以下是准备工作

from PIL import Image
import numpy as np
import torchvision.transforms as tfs
import matplotlib.pyplot as plt
 
img_path = r"D:\CSDN_point\1_4\kabibala.jpg"
img = Image.open(img_path)
print("the shape of img is {}".format(np.array(img).shape))

图片伸缩

img_re = tfs.Resize((500,1000))(img)
plt.imshow(img_re)
plt.show()

tfs.Reszie((500,1000))把图像的高和宽分别拉伸到500像素和1000像素

图片裁剪

img_crop = tfs.RandomCrop(500)(img)
plt.imshow(img_crop)
plt.show()

tfs.RandomCrop(500)随机截取图片 $500\times500$ 大小的区域

中心裁剪

img_crop_cen = tfs.CenterCrop(700)(img)
plt.imshow(img_crop_cen)
plt.show()

tfs.CenterCrop(700)裁剪图片中心位置 $700\times700$ 大小的区域

随机水平翻转

# 随机水平翻转，概率是0.5
img_hori = tfs.RandomHorizontalFlip()(img)
# 随机垂直翻转，概率是0.5
img_ver = tfs.RandomVerticalFlip()(img)
 
plt.subplot(1,2,1)
plt.imshow(img_hori)
plt.title("RandomHorizontalFlip")
plt.subplot(1,2,2)
plt.imshow(img_ver)
plt.title("RandomVerticalFlip")
plt.show()

随机改变图片亮度、对比度和色相

img_j = tfs.ColorJitter(brightness=0.5,contrast=0.5,hue=0.5)(img)
plt.imshow(img_j)
plt.show()

tfs.ColorJitter(brightness=0.5,contrast=0.5,hue=0.5)中参数的含义：

brightness=0.5：亮度的浮点数系数，brightness系数在 [max(0, 1 - brightness), 1 + brightness] 的范围内随机选择。例如，brightness=0.5，就表明亮度在 [0.5, 1.5] 的范围内随机选择。
contrast=0.5：对比度的浮点数系数。对比度系数在 [max(0, 1 - contrast), 1 + contrast] 的范围内随机选择。例如，contrast=0.5，就表明对比度在 [0.5, 1.5] 的范围内随机选择。
hue=0.5：色相的浮点数系数。色相系数在 [-hue, hue] 的范围内随机选择。例如，hue=0.5，就表明色相在 [-0.5, 0.5] 的范围内随机选择。

多变换整合

可以使用Compose模块将多个变换进行整合

# 将多个变换整合到my_trans
my_trans = tfs.Compose([tfs.Resize(800),tfs.RandomHorizontalFlip(),tfs.RandomCrop(500),tfs.RandomVerticalFlip(),tfs.ColorJitter(brightness=0.5,contrast=0.5,hue=0.5)])
 
_,fig = plt.subplots(3,3)
for i in range(3):
    for j in range(3):
        fig[i][j].imshow(my_trans(img))
        plt.axis('off')
plt.show()

以上就是基于pytorch实现对图片进行数据增强的详细内容，更多关于pytorch图片数据增强的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

在Lighttpd服务器中运行Django应用的方法
这篇文章主要介绍了在Lighttpd服务器中运行Django应用的方法,本文所采用的是最流行的FastCGI模块,包括同时运行多个Django应用的方法,需要的朋友可以参考下
2015-07-07
Python脚本获取操作系统版本信息
本文给大家分享的小技巧是如何利用Python脚本获取Windows和Linux的系统版本信息，非常的简单实用，有需要的小伙伴可以查看下
2016-12-12
python 二维数组90度旋转的方法
今天小编就为大家分享一篇python 二维数组90度旋转的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-01-01
Python+uiautomator2实现手机锁屏解锁功能
python-uiautomator2封装了谷歌自带的uiautomator2测试框架，提供便利的python接口，这篇文章给大家介绍使用Python+uiautomator2实现手机锁屏解锁（期望输入的锁屏密码，基于滑动解锁），感兴趣的朋友一起看看吧
2021-04-04
使用Python3制作TCP端口扫描器
本文给大家分享的是使用Python3 实现TCP全连接端口扫描器的制作过程，包括思路和代码，非常简单易懂，推荐给大家
2017-04-04
Python模拟简易版淘宝客服机器人的示例代码
这篇文章主要介绍了Python模拟简易版淘宝客服机器人的示例代码，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-03-03
python flask解析json数据不完整的解决方法
这篇文章主要介绍了python flask解析json数据不完整的解决方法，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2019-05-05
Python学习笔记整理3之输入输出、python eval函数
这篇文章主要介绍了Python学习笔记整理3之输入输出、python eval函数的相关资料,需要的朋友可以参考下
2015-12-12
Python搭建Spark分布式集群环境
这篇文章主要介绍了Spark分布式集群环境搭建基于Python版，Apache Spark 是一个新兴的大数据处理通用引擎，提供了分布式的内存抽象。100 倍本文而是使用三台电脑来搭建一个小型分布式集群环境安装,需要的朋友可以参考下
2019-07-07
PyCharm中代码字体大小调整方法
在本篇文章里小编给大家分享了关于PyCharm中代码字体大小调整方法以及相关知识点，需要的朋友们学习下。
2019-07-07