利用Python实现简单的验证码处理
序言
我们在做采集数据的时候,过快或者访问频繁,或者一访问就给弹出验证码,然后就蚌珠了~
今天就给大家来一个简单处理验证码的方法
环境模块
这里需要用到一个 ddddocr 模块 ,这是别人开源写好的一个东西,简单又好用,但是精确度差一点点,但是还是非常好用的。
如果你追求精确度的话,可以调用别人写好的一些API 。
咱们直接 win+r 弹出搜索框后输入 cmd ,点击确定弹出命令提示符窗口, 输入pip install ddddocr 即可安装。
不会的话详细参考我置顶文章有详细讲解。
代码展示
代码不多,非常简单。
模块安装好之后咱们先导入一下:
import ddddocr
然后实例化一下,用一个 cor 接收一下这个数据。
ocr = ddddocr.DdddOcr()
我这里准备了四个验证码:
首先我们用 with open 来读取一下这文件,读取方式使用 rb ,因为是图片的话就读取它的二进制数据
with open('img_3.png', 'rb') as f:
使用 f.read() 将数据读取出来,再自定义一个变量接收一下。
img_bytes = f.read()
然后我们通过 classification 将它传进去,把结果打印出来就可以了。
result = ocr.classification(img_bytes) print(result)
实现效果:
纯数字的
字母+数字的
可以看到都完整的识别出来了,即使上面有一些花里胡哨的横线啥的。
完整代码
import ddddocr ocr = ddddocr.DdddOcr() with open('img_3.png', 'rb') as f: img_bytes = f.read() result = ocr.classification(img_bytes) print(result)
大家可以自己去试试,也可以直接应用在采集数据实践当中~
到此这篇关于利用Python实现简单的验证码处理的文章就介绍到这了,更多相关 Python验证码处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
Python PyQt5干货满满小项目轻松实现高效抠图去背景
PyQt5以一套Python模块的形式来实现功能。它包含了超过620个类,600个方法和函数。本篇文章手把手带你用PyQt5轻松实现图片扣除背景,大家可以在过程中查缺补漏,提升水平2021-11-11解决Django 在ForeignKey中出现 non-nullable field错误的问题
今天小编就为大家分享一篇解决Django 在ForeignKey中出现 non-nullable field错误的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2019-08-08Python中判断语句入门指南(if elif else语句)
if elif else语句是Python中的控制语句,用于根据条件执行不同的操作,下面这篇文章主要给大家介绍了关于Python中判断语句入门指南(if elif else语句)的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下2023-05-05Python使用Dijkstra算法实现求解图中最短路径距离问题详解
这篇文章主要介绍了Python使用Dijkstra算法实现求解图中最短路径距离问题,简单描述了Dijkstra算法的原理并结合具体实例形式分析了Python使用Dijkstra算法实现求解图中最短路径距离的相关步骤与操作技巧,需要的朋友可以参考下2018-05-05
最新评论