Python 读取xml数据,cv2裁剪图片实例

更新时间：2020年03月10日 09:55:46 作者：竹子熊猫

这篇文章主要介绍了Python 读取xml数据,cv2裁剪图片实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

下载的数据是pascal voc2012的数据，已经有annotation了，不过是xml格式的，训练的模型是在Google模型的基础上加了两层网络，因此要在原始图像中裁剪出用于训练的部分图像。

另外，在原来给的标注框的基础上，做了点框的移动。最后同类目标存储在同一文件夹中。

from __future__ import division
import os
from PIL import Image
import xml.dom.minidom
import numpy as np
 
ImgPath = 'C:/Users/Desktop/XML_try/img/' 
AnnoPath = 'C:/Users/Desktop/XML_try/xml/'
ProcessedPath = 'C:/Users/Desktop/CropedVOC/'
 
imagelist = os.listdir(ImgPath)
for image in imagelist:
	image_pre, ext = os.path.splitext(image)
	imgfile = ImgPath + image 
	xmlfile = AnnoPath + image_pre + '.xml'
	
	DomTree = xml.dom.minidom.parse(xmlfile)
	annotation = DomTree.documentElement
 
	filenamelist = annotation.getElementsByTagName('filename') #[<DOM Element: filename at 0x381f788>]
	filename = filenamelist[0].childNodes[0].data
	objectlist = annotation.getElementsByTagName('object')
	
	i = 1
	for objects in objectlist:
		
		namelist = objects.getElementsByTagName('name')
		objectname = namelist[0].childNodes[0].data
 
		savepath = ProcessedPath + objectname
 
		if not os.path.exists(savepath):
			os.makedirs(savepath)
 
		bndbox = objects.getElementsByTagName('bndbox')
		cropboxes = []
 
		for box in bndbox:
			x1_list = box.getElementsByTagName('xmin')
			x1 = int(x1_list[0].childNodes[0].data)
			y1_list = box.getElementsByTagName('ymin')
			y1 = int(y1_list[0].childNodes[0].data)
			x2_list = box.getElementsByTagName('xmax')
			x2 = int(x2_list[0].childNodes[0].data)
			y2_list = box.getElementsByTagName('ymax')
			y2 = int(y2_list[0].childNodes[0].data)
 
			w = x2 - x1
			h = y2 - y1
 
			obj = np.array([x1,y1,x2,y2])
			shift = np.array([[0.8,0.8,1.2,1.2],[0.9,0.9,1.1,1.1],[1,1,1,1],[0.7,0.7,1,1],[1,1,1.2,1.2],\
				[0.7,1,1,1.2],[1,0.7,1.2,1],[(x1+w*1/3)/x1,(y1+h*1/3)/y1,(x2+w*1/3)/x2,(y2+h*1/3)/y2],\
				[(x1-w*1/3)/x1,(y1-h*1/3)/y1,(x2-w*1/3)/x2,(y2-h*1/3)/y2]])
 
			XYmatrix = np.tile(obj,(9,1)) 
			cropboxes = XYmatrix * shift
 
			img = Image.open(imgfile)
			for cropbox in cropboxes:
				cropedimg = img.crop(cropbox)
				cropedimg.save(savepath + '/' + image_pre + '_' + str(i) + '.jpg')
				i += 1

补充知识：python-----截取xml文件画框的图片并保存

from __future__ import division
import os
from PIL import Image
import xml.dom.minidom
import numpy as np
ImgPath = r'D:\tmp\video_wang_mod\01\00022_8253_0021_3\output/'
AnnoPath = r'D:\tmp\video_wang_mod\01\00022_8253_0021_3\Annotations/'
ProcessedPath = r'D:\tmp\video_wang_mod\01\00022_8253_0021_3\cut/'

imagelist = os.listdir(ImgPath)

for image in imagelist:
  image_pre, ext = os.path.splitext(image)
  imgfile = ImgPath + image
  print(imgfile)
  if not os.path.exists(AnnoPath + image_pre + '.xml' ):
    continue
  xmlfile = AnnoPath + image_pre + '.xml'
  DomTree = xml.dom.minidom.parse(xmlfile)
  annotation = DomTree.documentElement
  filenamelist = annotation.getElementsByTagName('filename')
  filename = filenamelist[0].childNodes[0].data
  objectlist = annotation.getElementsByTagName('object')
  i = 1
  for objects in objectlist:
    namelist = objects.getElementsByTagName('name')
    objectname = namelist[0].childNodes[0].data
    savepath = ProcessedPath + objectname
    if not os.path.exists(savepath):
      os.makedirs(savepath)
    bndbox = objects.getElementsByTagName('bndbox')
    cropboxes = []
    for box in bndbox:
      x1_list = box.getElementsByTagName('xmin')
      x1 = int(x1_list[0].childNodes[0].data)
      y1_list = box.getElementsByTagName('ymin')
      y1 = int(y1_list[0].childNodes[0].data)
      x2_list = box.getElementsByTagName('xmax')
      x2 = int(x2_list[0].childNodes[0].data)
      y2_list = box.getElementsByTagName('ymax')
      y2 = int(y2_list[0].childNodes[0].data)
      w = x2 - x1
      h = y2 - y1
      obj = np.array([x1,y1,x2,y2])
      shift = np.array([[1,1,1,1]])
      XYmatrix = np.tile(obj,(1,1))
      cropboxes = XYmatrix * shift
      img = Image.open(imgfile)
      for cropbox in cropboxes:
        cropedimg = img.crop(cropbox)
        cropedimg.save(savepath + '/' + image_pre + '_' + str(i) + '.jpg')
        i += 1

以上这篇Python 读取xml数据,cv2裁剪图片实例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

Python学习开发之图形用户界面详解
当前流行的计算机桌面应用程序大多数为图形化用户界面（Graphic User Interface,GUI）,python也提供了多个图形开发界面的库,这篇文章主要给大家介绍了关于Python学习开发之图形用户界面的相关资料,需要的朋友可以参考下
2021-08-08
python学习手册中的python多态示例代码
多态是面向对象语言的一个基本特性，多态意味着变量并不知道引用的对象是什么，根据引用对象的不同表现不同的行为方式，下面使用一个示例学习他的使用方法
2014-01-01
使用Python插入SVG到PDF文档中的方法示例
将SVG（可缩放矢量图形）文件插入到PDF（便携式文档格式）文件中不仅能够保留SVG图像的矢量特性,确保图像在任何分辨率下都保持清晰,使得技术文档、手册、报告等内容更加丰富多样且易于传播,本文将介绍如何使用Python插入SVG文件到PDF文档中,需要的朋友可以参考下
2024-08-08
Python NumPy 数组索引的示例详解
数组索引是指使用方括号（[]）来索引数组值,numpy提供了比常规的python序列更多的索引工具，除了按整数和切片索引之外，数组可以由整数数组索引、布尔索引及花式索引，这篇文章主要介绍了Python NumPy 数组索引,需要的朋友可以参考下
2023-01-01
Linux CentOS7下安装python3 的方法
在CentOS7下，默认安装的就是python2.7，下面通过本文给大家分享Linux CentOS7下安装python3 的方法，需要的朋友参考下吧
2018-01-01
Python multiprocessing.value实现多进程数据共享的示例
本文介绍了Python中的multiprocessing.value，通过示例代码展示了如何使用这个类实现多进程数据共享，以及使用场景和注意事项等内容，感兴趣的朋友跟随小编一起看看吧
2023-07-07
Django框架会话技术实例分析【Cookie与Session】
这篇文章主要介绍了Django框架会话技术,结合实例形式分析了Django框架Cookie与Session相关使用技巧与注意事项,需要的朋友可以参考下
2019-05-05
全面了解django的缓存机制及使用方法
这篇文章主要介绍了全面了解django的缓存机制,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-07-07
带你从内存的角度看Python中的变量
这篇文章主要为大家介绍了从内存的角度看Python中的变量，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助
2022-01-01
详细介绍python类及类的用法
前面我们介绍了类的创建及面向对象的三大特性.本篇将详细介绍Python 类的成员,成员修饰符,类的特殊成员.需要的朋友可以参考下
2021-05-05

Python 读取xml数据,cv2裁剪图片实例

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具