Python selenium+cookie实现免密登陆的示例代码

 更新时间:2022年02月21日 11:05:59   作者:饿霸飞鸟  
本文主要介绍了Python selenium+cookie实现免密登陆的示例代码,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

今天爬取airbnb的租房数据时,遇到了登陆问题。自己动手解决了一下。

我们知道,http是无状态的,那么网页如何实现用户登陆注册功能呢?Session和Cookie就是为了满足这种需求出现的技术。

首先介绍一下Session和Cookie的概念。

在Web中Session对象存储特定用户会话所需的属性及配置信息。这样,当用户在应用程序的Web页之间跳转时,存储在Session对象中的变量将不会丢失,而是在整个用户会话中一直存在下去。当用户请求来自应用程序的 Web页时,如果该用户还没有会话,则Web服务器将自动创建一个 Session对象。当会话过期或被放弃后,服务器将终止该会话。

Cookie,有时也用其复数形式 Cookies。类型为“小型文本文件”,是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。

当用户第一次访问某个网页时,服务器会创建一个Session对象,用于存储与该用户会话的属性以及配置信息,并且返回一个带有set-cookie字段的响应头给客户端,客户端浏览器会把cookie保存到本地,下一次访问该网页时,会加上cookie。服务器通过cookie辨认是否有用户的Session。这样就实现了用户的登陆注册功能,但是Session和Cookie的应用远不及此,这里不再赘述。

那么为了实现免密登陆,我们需要做如下几件事情:

获取登陆airbnb时客户端浏览器存储的cookies。

把cookies写入本地。

下次用selenium登陆airbnb时,把cookies带上。

获取cookies:

使用selenium的get_cookies()函数来获取cookies。

但是如何实现登陆呢?总得要先登陆了,才能有cookies吧?可以在代码中加一段休眠时间,在休眠时间我们手动完成登陆,休眠过后,再让代码记录cookies即可。

import time
 
from msedge.selenium_tools import Edge, EdgeOptions
import chardet
 
 
# 返回一个driver对象
def activate_selenium_driver():
    options = EdgeOptions()
    # options.use_chromium = True
    options.add_experimental_option('excludeSwitches', ['enable-automation'])
    options.binary_location = r"C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe"  # 浏览器的位置
    driver = Edge(options=options, executable_path=r"D:\ERic\WORK\python\Spider\msedgedriver.exe")  # 相应的浏览器的驱动位置
    return driver
 
 
def check_charset(file_path):
    with open(file_path, "rb") as f:
        data = f.read(4)
        charset = chardet.detect(data)['encoding']
    return charset
 
baseurl = 'https://www.airbnb.cn/s/%E6%B7%B1%E5%9C%B3/homes?refinement_paths%5B%5D=%2Fhomes&current_tab_id=home_tab&selected_tab_id=home_tab&screen_size=large&hide_dates_and_guests_filters=false&place_id=ChIJkVLh0Aj0AzQRyYCStw1V7v0&map_toggle=false'
driver = activate_selenium_driver()
driver.get(baseurl)
 
# 20秒的休眠时间以手动完成登陆
for i in range(0, 20):
    print(20 - i)
    time.sleep(1)
 
# 获取cookies
cookies = driver.get_cookies()
 
# 保存到本地
with open('cookies.txt', 'w', encoding=check_charset('cookies.txt')) as f:
    for i in cookies:
        f.write(str(i))
        f.write('\n')

携带cookies实现免密登陆:

baseurl = 'https://www.airbnb.cn/s/%E6%B7%B1%E5%9C%B3/homes?refinement_paths%5B%5D=%2Fhomes&current_tab_id=home_tab&selected_tab_id=home_tab&screen_size=large&hide_dates_and_guests_filters=false&place_id=ChIJkVLh0Aj0AzQRyYCStw1V7v0&map_toggle=false'
driver.get(baseurl)
cookies = []
with open('cookies.txt', 'r', encoding=funcs.funcs.check_charset('cookies.txt')) as f:
    for i in f:
        cookies.append(eval(i.strip()))
 
for i in cookies:
    driver.add_cookie(i)
 
time.sleep(3)
driver.refresh()

再次打开Airbnb时,发现已经是登陆状态,大功告成辣。

 到此这篇关于Python selenium+cookie实现免密登陆的示例代码的文章就介绍到这了,更多相关selenium cookie免密登陆内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • django 多数据库配置教程

    django 多数据库配置教程

    今天小编就为大家分享一篇django 多数据库配置教程,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • 让python在hadoop上跑起来

    让python在hadoop上跑起来

    让python在hadoop上跑起来,python如何在hadoop上跑起来?感兴趣的小伙伴们可以参考一下
    2016-01-01
  • Python创建Getter和Setter的方法详解

    Python创建Getter和Setter的方法详解

    Getters 和 Setters 是帮助我们设置类变量或属性而无需直接访问的方法,这篇文章主要和大家介绍了如何在Python中创建Getter和Setter,需要的可以参考下
    2023-10-10
  • python机器学习之随机森林(七)

    python机器学习之随机森林(七)

    这篇文章主要为大家详细介绍了python机器学习之随机森林,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • Python字符串、整数、和浮点型数相互转换实例

    Python字符串、整数、和浮点型数相互转换实例

    今天小编就为大家分享一篇Python字符串、整数、和浮点型数相互转换实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-08-08
  • python神经网络pytorch中BN运算操作自实现

    python神经网络pytorch中BN运算操作自实现

    这篇文章主要为大家介绍了python神经网络pytorch中BN运算操作自实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • python利用标准库如何获取本地IP示例详解

    python利用标准库如何获取本地IP示例详解

    这篇文章主要给大家介绍了关于python利用标准库如何获取本地IP的相关资料,文中先对python的标准库进行了简单的介绍,而后给大家详细介绍了关于python用标准库获取本地IP的实现方法,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧。
    2017-11-11
  • Django中prefetch_related()函数优化实战指南

    Django中prefetch_related()函数优化实战指南

    我们可以利用Django框架中select_related和prefetch_related函数对数据库查询优化,这篇文章主要给大家介绍了关于Django中prefetch_related()函数优化的相关资料,需要的朋友可以参考下
    2022-11-11
  • 详解Python的Flask框架中生成SECRET_KEY密钥的方法

    详解Python的Flask框架中生成SECRET_KEY密钥的方法

    密钥值的生成功能十分重要,几乎也是各大Web开发框架的标配,Flask当然也不例外,这里我们就来详解Python的Flask框架中生成SECRET_KEY密钥的方法
    2016-06-06
  • 树莓派采用socket方式文件传输(python)

    树莓派采用socket方式文件传输(python)

    这篇文章主要为大家详细介绍了树莓派采用socket方式文件传输,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-06-06

最新评论