python中超简单的字符分割算法记录(车牌识别、仪表识别等)

更新时间：2021年09月24日 09:57:23 作者：听、风

这篇文章主要给大家介绍了关于python中超简单的字符分割算法记录，如车牌识别、仪表识别等,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

背景

在诸如车牌识别，数字仪表识别等问题中，最关键的就是将单个的字符分割开来再分别进行识别，如下图。最近刚好用到，就自己写了一个简单地算法进行字符分割，来记录一下。

图像预处理

彩图二值化以减小参数量，再进行腐蚀膨胀去除噪点。

image = cv2.imread('F://demo.jpg', 0)  # 读取为灰度图
_, image = cv2.threshold(image, 50, 255, cv2.THRESH_BINARY)  # 二值化
kernel1 = cv2.getStructuringElement(cv2.MORPH_RECT, (7, 7))  # 腐蚀膨胀核
kernel2 = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))  # 腐蚀膨胀核
image = cv2.erode(image, kernel=kernel1)  # 腐蚀
image = cv2.dilate(image, kernel=kernel2)  # 膨胀

确定字符区域

考虑最理想的情况，图中的字符是端正没有倾斜歪曲的。将像素灰度矩阵分别进行列相加、行相加，则在得到的列和、行和数组中第一个非 0 元素索引到最后一个非 0 元素索引包裹的区间即就是字符区域。

h, w = image.shape  # 原图的高和宽
list1 = []  # 列和
list2 = []  # 行和

for i in range(w):
    list1.append(1 if image[:, i].sum() != 0 else 0)  # 列求和,不为0置1
for i in range(h):
    list2.append(1 if image[i, :].sum() != 0 else 0)  # 行求和,不为0置1

# 裁剪字符区域
# 求行的范围
flag = 0
for i, e in enumerate(list1):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_w = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_w = i
# 求列的范围
flag = 0
for i, e in enumerate(list2):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_h = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_h = i

print(start_w, end_w)  # 行索引范围
print(start_h, end_h)  # 列索引范围

分割单个字符

与分割全部字符区域同理，在行和数组中非 0 元素索引的范围即是单个字符的区域。

l = ([i for i, e in enumerate(list1) if e != 0])  # 列和列表中不为0的索引
img_list = []  # 分割数字图片存储列表
temp = []  # 存储某一个数字的所有行索引值
n = 0  # 数字图片数量

for x in l:
    temp.append(x)
    if x+1 not in l:  # 索引不连续的情况
        if len(temp) != 1:
            start_w = min(temp)  # 索引最小值
            end_w = max(temp)  # 索引最大值
            img_list.append(image[start_h:end_h, start_w:end_w])  # 对该索引包括数字切片
            n += 1
        temp = []

print(n)  # 字符数

完整源码

import cv2

start_h, end_h, start_w, end_w = 0, 0, 0, 0  # 字符区域的高和宽起止

image = cv2.imread('F://001_1.jpg', 0)  # 直接读取为灰度图
cv2.imshow('img_GRAY', image)

_, image = cv2.threshold(image, 50, 255, cv2.THRESH_BINARY)  # 二值化
cv2.imshow('img_BINARY', image)

# 去噪点
kernel1 = cv2.getStructuringElement(cv2.MORPH_RECT, (7, 7))  # 简单腐蚀膨胀核
kernel2 = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))  # 简单腐蚀膨胀核
image = cv2.erode(image, kernel=kernel1)  # 腐蚀
image = cv2.dilate(image, kernel=kernel2)  # 膨胀
cv2.imshow('img_denoise', image)


h, w = image.shape  # 原图的高和宽
# print(h, w)

list1 = []  # 列和
list2 = []  # 行和

for i in range(w):
    list1.append(1 if image[:, i].sum() != 0 else 0)  # 列求和,不为0置1
for i in range(h):
    list2.append(1 if image[i, :].sum() != 0 else 0)  # 行求和,不为0置1

# print(len(list1))
# print(len(list2))

# 裁剪字符区域
# 求行的范围
flag = 0
for i, e in enumerate(list1):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_w = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_w = i
# 求列的范围
flag = 0
for i, e in enumerate(list2):
    if e != 0:
        if flag == 0:  # 第一个不为0的位置记录
            start_h = i
            flag = 1
        else:  # 最后一个不为0的位置
            end_h = i

print(start_w, end_w)  # 行索引范围
print(start_h, end_h)  # 列索引范围

cv2.imshow('img_number', image[start_h:end_h, start_w:end_w])

l = ([i for i, e in enumerate(list1) if e != 0])  # 列和列表中不为0的索引
# print(l)

img_list = []  # 分割数字图片存储列表

temp = []  # 存储某一个数字的所有行索引值
n = 0  # 数字图片数量
for x in l:
    temp.append(x)
    if x+1 not in l:  # 索引不连续的情况
        if len(temp) != 1:
            start_w = min(temp)  # 索引最小值
            end_w = max(temp)  # 索引最大值
            img_list.append(image[start_h:end_h, start_w:end_w])  # 对该索引包括数字切片
            n += 1
            # print(temp)
        temp = []

print(n)  # 字符数

for i in range(n):  # 显示保存字符
    cv2.imshow('number'+str(i), img_list[i])
    cv2.imwrite('F://demo'+str(i+1).zfill(2)+'.jpg', img_list[i])

cv2.waitKey(0)

结语

利用列向和行向相加的方法简单分割字符的方法并不适用更加复杂的分割要求，另外算法中也没有考虑小数点分割问题，仅作为学习参考，欢迎有问题一起讨论交流。

到此这篇关于python中超简单的字符分割算法记录(车牌识别、仪表识别等)的文章就介绍到这了,更多相关python字符分割算法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

简单示例入门了解WxPython教程
这篇文章主要通过演示简单示例带大家入门了解WxPython，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2023-11-11
浅谈算法之最小生成树Kruskal的Python实现
最小生成树Kruskal算法可以称为“加边法”，初始最小生成树边数为0，每迭代一次就选择一条满足条件的最小代价边，加入到最小生成树的边集合里。本文将介绍它的原理，并用Python进行实现
2021-06-06
Python3.7基于hashlib和Crypto实现加签验签功能(实例代码)
这篇文章主要介绍了Python3.7基于hashlib和Crypto实现加签验签功能,环境是基于python3.7，本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
2019-12-12
探究python中open函数的使用
这篇文章主要为大家详细介绍了python中open函数的使用方法，对python文件方法open进行深入研究，感兴趣的小伙伴们可以参考一下
2016-03-03
解决Python print 输出文本显示 gbk 编码错误问题
这篇文章主要介绍了解决Python print 输出文本显示 gbk 编码错误问题,本文给出了三种解决方法，需要的朋友可以参考下
2018-07-07
用Python登录好友QQ空间点赞的示例代码
这篇文章主要介绍了用Python登录好友QQ空间点赞的示例代码，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2017-11-11
Python 中使用 PyMySQL模块操作数据库的方法
这篇文章主要介绍了Python 中使用 PyMySQL模块操作数据库的方法,非常不错，具有一定的参考借鉴价值，需要的朋友可以参考下
2019-11-11
Python 字符串的有关知识详解
这篇文章主要为大家介绍了Python的字符串，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助，希望能够给你带来帮助
2021-11-11
Anaconda 离线安装 python 包的操作方法
今天小编就为大家分享一篇Anaconda 离线安装 python 包的操作方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
python通过nmap扫描在线设备并尝试AAA登录(实例代码)
这篇文章主要介绍了python通过nmap扫描在线设备并尝试AAA登录,本文通过实例代码给大家介绍的非常详细，具有一定的参考借鉴价值，需要的朋友可以参考下
2019-12-12