基于python实现破解滑动验证码过程解析

 更新时间:2020年05月28日 10:33:58   作者:musen  
这篇文章主要介绍了基于python实现破解滑动验证码过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

前言:

很多小伙伴们反馈,在web自动化的过程中,经常会被登录的验证码给卡住,不知道如何去通过验证码的验证。今天专门给大家来聊聊验证码的问题,一般的情况下遇到验证码我们可以都可以找开发去帮忙解决,关闭验证码,或者给一个万能的验证码!那么如果开发不提供帮助的话,我们自己有没有办法来处理这些验证码的问题呢?答案当然是有的,常见的验证码一般分为两类,一类是图文验证码,一类是滑动验证码!

今天我们主要来聊聊滑动验证码如何去识别破解。

滑动验证破解思路

关于滑动验证码破解的思路大体上来讲就是以下两个步骤:

1、获取滑块滑动的距离

2、模拟拖动滑块,通过验证。

听起来是比较简单,但是获取滑块滑动的距离,大多数小伙伴没有思路,不知道怎么去获取。其实要获取下来也不难,关于这种滑动的验证码,滑块和缺口背景都是分别是一张独立的图片,我们可以把这两张图片,下载下来借助于图像识别的技术,去识别缺口在背景图中的位置,然后减去滑块当前所在位置,就可以得出需要滑动的距离。这个时候很多小伙伴会想图像识别技术我不会啊,不会没有关系,后面会给到大家一个封装好的滑块识别模块,只要你传入滑块和缺口背景图的元素节点就能计算出滑块的缺口位置。

案例讲解

话不多说,我们先来看一个案例(QQ空间登录),这边用到了一个我自己封装的滑动距离识别的模块slideVerfication,有需要的小伙伴可以私聊获取。qq空间登录案例实现步骤如下:

1、创建一个driver对象,访问qq登录页面

2、输入账号密码

3、点击登录

4、模拟滑动验证

实现代码

 import time
 from selenium import webdriver
 from slideVerfication import SlideVerificationCode
 ​
 # 1、创建一个driver对象,访问qq登录页面
 browser = webdriver.Chrome()
 browser.get("https://qzone.qq.com/")
 ​
 # 2、输入账号密码
 # 2.0 点击切换到登录的iframe
 browser.switch_to.frame('login_frame')
 # 2.1 点击账号密码登录
 browser.find_element_by_id('switcher_plogin').click()
 # 2.2定位账号输入框,输入账号
 browser.find_element_by_id("u").send_keys("123292678")
 # 2.3定位密码输入输入密码
 browser.find_element_by_id("p").send_keys("PYTHON01")
 # 3、点击登录
 browser.find_element_by_id('login_button').click()
 time.sleep(3)
 ​
 # 4、模拟滑动验证
 # 4.1切换到滑动验证码的iframe中
 tcaptcha = browser.find_element_by_id("tcaptcha_iframe")
 browser.switch_to.frame(tcaptcha)
 # 4.2 获取滑动相关的元素
 # 选择拖动滑块的节点
 slide_element = browser.find_element_by_id('tcaptcha_drag_thumb')
 # 获取滑块图片的节点
 slideBlock_ele = browser.find_element_by_id('slideBlock')
 # 获取缺口背景图片节点
 slideBg = browser.find_element_by_id('slideBg')
 # 4.3计算滑动距离
 sc = SlideVerificationCode(save_image=True)
 distance = sc.get_element_slide_distance(slideBlock_ele,slideBg)
 # 滑动距离误差校正,滑动距离*图片在网页上显示的缩放比-滑块相对的初始位置
 distance = distance*(280/680) - 22
 print("校正后的滑动距离",distance)
 # 4.4、进行滑动
 sc.slide_verification(browser,slide_element,distance=100)

关于滑动验证码的识别问题就这样解决了,那么接下来给大家来讲讲封装的slideVerfication这个模块的识别原理,其实关于这个模块图像识别,也是借助了第三方的图像处理模块来进行识别的,python中有很多现成的用来处理图片的库,这边我使用的是opencv-python来进行识别的。slideVerfication模块上面用到的两个方法的部分参考代码如下:

def get_element_slide_distance(self, slider_ele, background_ele, correct=0):
     """
     根据传入滑块,和背景的节点,计算滑块的距离
 ​
     该方法只能计算 滑块和背景图都是一张完整图片的场景,
     如果背景图是通过多张小图拼接起来的背景图,
     该方法不适用,请使用get_image_slide_distance这个方法
     :param slider_ele: 滑块图片的节点
     :type slider_ele: WebElement
     :param background_ele: 背景图的节点
     :type background_ele:WebElement
     :param correct:滑块缺口截图的修正值,默认为0,调试截图是否正确的情况下才会用
     :type: int
     :return: 背景图缺口位置的X轴坐标位置(缺口图片左边界位置)
     """
     # 获取验证码的图片
     slider_url = slider_ele.get_attribute("src")
     background_url = background_ele.get_attribute("src")
     # 下载验证码背景图,滑动图片
     slider = "slider.jpg"
     background = "background.jpg"
     self.onload_save_img(slider_url, slider)
     self.onload_save_img(background_url, background)
     # 读取进行色度图片,转换为numpy中的数组类型数据,
     slider_pic = cv2.imread(slider, 0)
     background_pic = cv2.imread(background, 0)
     # 获取缺口图数组的形状 -->缺口图的宽和高
     width, height = slider_pic.shape[::-1]
     # 将处理之后的图片另存
     slider01 = "slider01.jpg"
     background_01 = "background01.jpg"
     cv2.imwrite(background_01, background_pic)
     cv2.imwrite(slider01, slider_pic)
     # 读取另存的滑块图
     slider_pic = cv2.imread(slider01)
     # 进行色彩转换
     slider_pic = cv2.cvtColor(slider_pic, cv2.COLOR_BGR2GRAY)
     # 获取色差的绝对值
     slider_pic = abs(255 - slider_pic)
     # 保存图片
     cv2.imwrite(slider01, slider_pic)
     # 读取滑块
     slider_pic = cv2.imread(slider01)
     # 读取背景图
     background_pic = cv2.imread(background_01)
     # 比较两张图的重叠区域
     result = cv2.matchTemplate(slider_pic, background_pic, cv2.TM_CCOEFF_NORMED)
     # 获取图片的缺口位置
     top, left = np.unravel_index(result.argmax(), result.shape)
     # 背景图中的图片缺口坐标位置
     print("当前滑块的缺口位置:", (left, top, left + width, top + height))
     return left
   def slide_verification(self, driver, slide_element, distance):
     """
     滑动滑块进行验证
     
     :param driver: driver对象
     :type driver:webdriver.Chrome
     :param slide_element: 滑块的元组
     :type slider_ele: WebElement
     :param distance: 滑动的距离
     :type: int
     :return:
     """
     # 获取滑动前页面的url地址
     start_url = driver.current_url
     print("需要滑动的距离为:", distance)
     # 根据滑动距离生成滑动轨迹
     locus = self.get_slide_locus(distance)
     print("生成的滑动轨迹为:{},轨迹的距离之和为{}".format(locus, distance))
     # 按下鼠标左键
     ActionChains(driver).click_and_hold(slide_element).perform()
     time.sleep(0.5)
     # 遍历轨迹进行滑动
     for loc in locus:
       time.sleep(0.01)
       ActionChains(driver).move_by_offset(loc, random.randint(-5, 5)).perform()
       ActionChains(driver).context_click(slide_element)
     # 释放鼠标
     ActionChains(driver).release(on_element=slide_element).perform()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • 详解利用python-highcharts库绘制交互式可视化图表

    详解利用python-highcharts库绘制交互式可视化图表

    本文主要和大家分享一个超强交互式可视化绘制工具-python-highcharts。python-highcharts就是使用Python进行Highcharts项目绘制,简单的说就是实现Python和Javascript之间的简单转换层,感兴趣的可以了解一下
    2022-03-03
  • python中利用zfill方法自动给数字前面补0

    python中利用zfill方法自动给数字前面补0

    python中有一个zfill方法用来给字符串前面补0,非常不错,下面小编给大家分享了实例代码,非常不错,具有参考借鉴价值,需要的朋友参考下吧
    2018-04-04
  • python中字符串变二维数组的实例讲解

    python中字符串变二维数组的实例讲解

    下面小编就为大家分享一篇python中字符串变二维数组的实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Python获取服务器信息的最简单实现方法

    Python获取服务器信息的最简单实现方法

    这篇文章主要介绍了Python获取服务器信息的最简单实现方法,涉及Python中urllib2库的使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03
  • python的图形用户界面介绍

    python的图形用户界面介绍

    大家好,本篇文章主要讲的是python的图形用户界面介绍,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
    2022-01-01
  • Python模拟登录之滑块验证码的破解(实例代码)

    Python模拟登录之滑块验证码的破解(实例代码)

    这篇文章主要介绍了Python模拟登录之滑块验证码的破解(实例代码),代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-11-11
  • Python中最好用的json库orjson用法详解

    Python中最好用的json库orjson用法详解

    orjson是一个用于python的快速、正确的json库,它的基准是 json最快的python库,具有全面的单元、集成和互操作性测试,下面这篇文章主要给大家介绍了关于Python中最好用的json库orjson用法的相关资料,需要的朋友可以参考下
    2022-06-06
  • Python库 Bokeh 数据可视化实用指南

    Python库 Bokeh 数据可视化实用指南

    大家好,今天跟大家分享的是交互式可视化神器 Python Bokeh 的详细使用教程,Bokeh是一个面向现代web浏览器的交互式可视化库。它提供了多功能图形的优雅、简洁的构造,并在大型数据集或流式数据集上提供了高性能的交互性,接下来让我们详细看看吧
    2021-11-11
  • python使用scrapy发送post请求的坑

    python使用scrapy发送post请求的坑

    这篇文章主要介绍了使用scrapy发送post请求的坑,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-09-09
  • python--pip--安装超时的解决方案

    python--pip--安装超时的解决方案

    这篇文章主要介绍了python--pip--安装超时的解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02

最新评论