复杂背景的验证码识别破解 以Discuz的动画验证码为例。
发布时间:2009-11-06 00:45:18 作者:佚名 我要评论
对于比较复杂的验证码,比如DZ论坛最新的验证码,处理起来相对麻烦一些,但是原理还是和普通的识别一样的,无非多了个背景处理的方案,看如下对DZ论坛的验证码的识别的思路
对于比较复杂的验证码,比如DZ论坛最新的验证码,处理起来相对麻烦一些,但是原理还是和普通的识别一样的,无非多了个背景处理的方案,看如下对DZ论坛的验证码的识别的思路
首先我们要去除它的背景,对于这样稍微复杂的背景,用过去的方法很难做到,上图的例子还不是很明显,我发现很多图片背景色和字母色近似,而且字母颜色是不断变化的,背景也是不断变化的
那我初始的想法是找到图片中使用颜色最多的方法,于是我们用HSL表示各点颜色,接着进行统计,得到最大的几个峰值,这里便是图片中几个最丰富的颜色的L值得累加值
其余的都可以认为是噪音,我们对每个峰值进行分割,得到如下图片
你看这样就把单个颜色图片分割出来了,接下来就是找到图片中除去黑色和白色后的图片
然后进行灰化处理,阀值处理,降噪,得到
接着根据边界检测出来的最左侧x位置,来排序字母顺序
接下来的事情就轻车熟路了,把图片转成标准模板,通过少量学习就达到了95%以上的识别率
c:15 j:8 8:7 t:9 9:4 x:7 4:6 2:4 h:7 f:8 e:18 b:5 y:3 k:4 w:3 g:5 3:5 7:6 r:2 m:3 q:4 v:2 p:3 6:2
以上数据表示 c学习15次 j学习8次…
只要字符不粘连,大部分验证码干扰技术都是可以有办法,所以为什么google验证码看起来很简单,但是没有人能够很好的破解它得原因。
补充,
rise在留言中发现有一些字符加入杂点的问题,由于这种验证码不是很普遍,稍微做了研究
CY3E 这个图片3字中有杂点,其他没有,按照文章中介绍的办法,怎么知道这个3不是像其他颜色杂点一样的图片呢?
我觉得需要加入一个步骤,就是对每次过滤颜色生成出来的图片,进行填充
找到3的杂点原图:
然后我们进行算法填充
这个图片与其他全部是杂点的图片之间的差别进行过滤,我考虑可以通过以下方法:
1、连贯点的宽度
2、连贯点的个数
这样剩下的就只剩下CY3E的过滤后的图片
至于字符倾斜的问题,我觉得完全可以在机器学习过程中,我们自己旋转正在学习的图片一定角度,例如从-10到+10度,只不过这样的学习库会大一些,但是就10个数字的验证码来说,这点性能损失应该可以忽略不计。
首先我们要去除它的背景,对于这样稍微复杂的背景,用过去的方法很难做到,上图的例子还不是很明显,我发现很多图片背景色和字母色近似,而且字母颜色是不断变化的,背景也是不断变化的
那我初始的想法是找到图片中使用颜色最多的方法,于是我们用HSL表示各点颜色,接着进行统计,得到最大的几个峰值,这里便是图片中几个最丰富的颜色的L值得累加值
其余的都可以认为是噪音,我们对每个峰值进行分割,得到如下图片
你看这样就把单个颜色图片分割出来了,接下来就是找到图片中除去黑色和白色后的图片
然后进行灰化处理,阀值处理,降噪,得到
接着根据边界检测出来的最左侧x位置,来排序字母顺序
接下来的事情就轻车熟路了,把图片转成标准模板,通过少量学习就达到了95%以上的识别率
c:15 j:8 8:7 t:9 9:4 x:7 4:6 2:4 h:7 f:8 e:18 b:5 y:3 k:4 w:3 g:5 3:5 7:6 r:2 m:3 q:4 v:2 p:3 6:2
以上数据表示 c学习15次 j学习8次…
只要字符不粘连,大部分验证码干扰技术都是可以有办法,所以为什么google验证码看起来很简单,但是没有人能够很好的破解它得原因。
补充,
rise在留言中发现有一些字符加入杂点的问题,由于这种验证码不是很普遍,稍微做了研究
CY3E 这个图片3字中有杂点,其他没有,按照文章中介绍的办法,怎么知道这个3不是像其他颜色杂点一样的图片呢?
我觉得需要加入一个步骤,就是对每次过滤颜色生成出来的图片,进行填充
找到3的杂点原图:
然后我们进行算法填充
这个图片与其他全部是杂点的图片之间的差别进行过滤,我考虑可以通过以下方法:
1、连贯点的宽度
2、连贯点的个数
这样剩下的就只剩下CY3E的过滤后的图片
至于字符倾斜的问题,我觉得完全可以在机器学习过程中,我们自己旋转正在学习的图片一定角度,例如从-10到+10度,只不过这样的学习库会大一些,但是就10个数字的验证码来说,这点性能损失应该可以忽略不计。
相关文章
网站域名被劫持、网站dns被劫持 域名跳转到别的网站的解决方法
网站域名被劫持,网站dns被劫持,域名跳转到别的网站怎么解决? 出现网站域名跳转到其他网站,这一现象很可能是域名被劫持2013-07-05- QQ账号和微博账号都属于个人财产,虽然网络账号被盗取暂时还没有明确的相关法律规定。但国家已经发布了互联网管理的基础性法规《互联网信息服务管理办法》进行规范,也已经2013-01-16
- 网络安全是一门涉及计算机、网络、通讯、密码、信息安全、应用数学、数论、信息论等多种学科的综合性学科,涉及面极广,而且不断更新和发展2013-03-20
- HSRP:热备份路由器协议(HSRP:Hot Standby Router Protocol),是cisco平台一种特有的技术,是cisco的私有协议。2012-05-14
- 本文介绍了WAPI与WIFI的区别2012-06-12
- DDoS攻击其实就是一种利用某种技术手段将目标服务器与互联网连接的所有通道堵死,从而造成服务器与互联网失去联系,正常访问者无法获取服务器上的数据。我们这样解释详细很2014-08-25
- 询问Wi-Fi密码已经成为大部分用户到新地方要做的第一件事,但大部分人并不具备Wi-Fi安全的相关意识。2015-03-30
- 为了节约自己的移动数据流量,很多网友会选择在公共场所使用免费wifi,近日,央视315晚会上曝光了免费WiFi的安全问题,呼吁手机用户警惕黑网,公共场所免费wifi如何安全使用2015-03-17
- 随着互联网一步一步的融入到我们的生活,我们的一些隐私已成了一种威胁,所以要时时刻刻注意自己我在网络上留下的“脚印”,一起来看看需要注意什么吧2016-08-23
最新评论