OpenCV(python)版实现文本分割之水平投影法

 更新时间:2022年08月03日 10:33:42   作者:Keras深度学习  
本文主要介绍了OpenCV(python)版实现文本分割之水平投影法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

对于如下一张图片,如何将文本区域分割成一行一行的了?

在这里插入图片描述

在文本分割领域中有一种很优秀的算法:投影法,包括水平投影法和垂直投影法。本文主要讲述水平投影法,水平投影法可以理解为一束光线从图像的左侧向右边进行照射,每一条光线可以理解为图像的一行,计算每一行上图像的黑色像素点,从而可以对图像进行分割。

import numpy as np 
import cv2 

def get_vvList(list_data):
    #取出list中像素存在的区间
    vv_list=list()
    v_list=list()
    for index,i in enumerate(list_data):
        if i>0:
            v_list.append(index)
        else:
            if v_list:
                vv_list.append(v_list)
                #list的clear与[]有区别
                v_list=[]
    return vv_list

if __name__=='__main__':
    img_bgr=cv2.imread('./testImg/1.png',1)
    if not img_bgr is None:
        img=img_bgr.copy()
        img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        #二值化
        t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
        '''
        水平投影从左向右投射,计算每一行的黑色像素总数
        '''
        rows,cols=binary.shape
        hor_list=[0]*rows
        for i in range(rows):
            for j in range(cols):
                #统计每一行的黑色像素总数
                if binary.item(i,j)==0:
                    hor_list[i]=hor_list[i]+1
        '''
        对hor_list中的元素进行筛选,可以去除一些噪点
        '''
        hor_arr=np.array(hor_list)
        hor_arr[np.where(hor_arr<5)]=0
        hor_list=hor_arr.tolist()

        #绘制水平投影
        img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
        for i in range(rows):
            pt1=(cols-1,i)
            pt2=(cols-1-hor_list[i],i)
            cv2.line(img_white,pt1,pt2,(0,),1)
        cv2.imshow('水平投影',img_white)
        cv2.waitKey(0)
        
        #取出各个文字区间
        vv_list=get_vvList(hor_list)
        for i in vv_list:
            img_hor=img_bgr[i[0]:i[-1],:,:]
            cv2.imshow('文本行',img_hor)
            cv2.waitKey(0)

运行上述代码,可以看到水平投影的效果。

在这里插入图片描述

根据投影法的特征,可以很容易就将上述文本分割成文本行,如下图所示:

在这里插入图片描述

到此这篇关于OpenCV(python)版实现文本分割之水平投影法的文章就介绍到这了,更多相关OpenCV水平投影 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • pytorch绘制曲线的方法

    pytorch绘制曲线的方法

    这篇文章主要为大家详细介绍了pytorch绘制曲线的方法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-03-03
  • Django 如何使用日期时间选择器规范用户的时间输入示例代码详解

    Django 如何使用日期时间选择器规范用户的时间输入示例代码详解

    这篇文章主要介绍了 Django 如何使用日期时间选择器规范用户的时间输入,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-05-05
  • 利用python查看数组中的所有元素是否相同

    利用python查看数组中的所有元素是否相同

    这篇文章主要给大家介绍了关于如何利用python查看数组中的所有元素是否相同的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 一文教你利用Python制作一个C盘清理器

    一文教你利用Python制作一个C盘清理器

    关于电脑的垃圾清理操作,已经有很多的成熟的软件可以帮助我们完成C盘的垃圾清理操作,比如360等等。但是使用三方的清理软件往往伴随着很多的广告,所以本文就来用Python制作一个C盘清理器吧
    2023-03-03
  • 如何使用python爬取知乎热榜Top50数据

    如何使用python爬取知乎热榜Top50数据

    主要是爬取知乎热榜的问题及点赞数比较高的答案,通过requests请求库进行爬取,对大家的学习或工作具有一定的价值,需要的朋友可以参考下
    2021-09-09
  • idea创建springMVC框架和配置小文件的教程图解

    idea创建springMVC框架和配置小文件的教程图解

    本文通过图文并茂的形式给大家介绍了idea创建springMVC框架和配置小文件的方法,非常不错,具有一定的参考借鉴价值,需要的朋友参考下吧
    2018-09-09
  • Selenium python时间控件输入问题解决方案

    Selenium python时间控件输入问题解决方案

    这篇文章主要介绍了Selenium python时间控件输入问题解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • Python恋爱小助手之必拿下

    Python恋爱小助手之必拿下

    小编有个好兄弟最近在追妹子,跟妹子打得火热!就差临门一脚了,这一jio我帮忙补上去了!他问有没有什么酷炫的表白方式,想要一次成功,表白的方式有许多种今天小编来给大家带来两个不得不同意的表白代码
    2021-10-10
  • pandas 强制类型转换 df.astype实例

    pandas 强制类型转换 df.astype实例

    这篇文章主要介绍了pandas 强制类型转换 df.astype实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • python执行js代码的方法

    python执行js代码的方法

    现在为了防止反爬,前端使用的反爬技术比较多的是js代码混淆。python作为爬虫界的扛把子,免不了和js打交道,因此我们需要了解如何使用Python执行js代码
    2021-05-05

最新评论