Python中Selenium对Cookie的操作方法

 更新时间:2021年07月09日 11:25:28   作者:繁华似锦Fighting  
Cookie内记录用户名和密码(加密)信息,只要请求时服务器收到Cookie,识别成功,默认为已登陆,今天通过本文给大家分享Selenium对Cookie的操作方法,感兴趣的朋友一起看看吧

1、Cookie介绍

HTTP协议是无状态的协议。一旦数据交换完毕,客户端与服务器端的连接就会关闭,再次交换数据需要建立新的连接,这就意味着服务器无法从连接上跟踪会话。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪个用户。举个例子:用户A购买了一件商品放入购物车内,当再次购买商品时,服务器已经无法判断该购买行为是属于用户A的会话,还是用户B的会话了。要跟踪该会话,必须引入一种机制。

什么是一次会话:

用户打开浏览器访问某个网站, 在这个网站上浏览任意页面, 访问完成后将浏览器关闭的过程称为是一次会话。

  • Cookie的出现就是为了解决这个问题,第一次登录后服务器后,如果服务器需要记录该用户状态,就使用Response向客户端浏览器颁发一个Cookie,浏览器会把Cookie数据保存在本地。该用户发送第二次请求的时候,就会自动的把上次请求存储的Cookie数据自动的携带给服务器,服务器检查该Cookie存储namevalue等信息,以此来辨认用户状态,服务器还可以根据需要修改Cookie的内容。
  • Cookie就相当于是服务器给客户端们颁发一个通行证,每人一个,无论谁访问都必须携带自己通行证。这样服务器就能从通行证上确认客户身份,这就是Cookie的工作原理。
  • Cookie存储的数据量有限,不同的浏览器有不同的存储大小,但一般不超过4KB,因此使用Cookie只能存储一些小量的数据。
  • Cookie的出现弥补HTTP协议无状态的不足。但是Cookie是存储在客户端的,通过浏览器或者抓包工具很容易就能获取到,所以非常不安全。

2、Session介绍

  • Session是另一种记录客户状态的机制,不同的是Cookie保存在客户端浏览器中,而Session保存在服务器上。客户端浏览器访问服务器的时候,服务器把客户端信息以某种形式记录在服务器上。存储在服务器的数据会更加的安全,不容易被窃取。客户端浏览器再次访问时,只需要从该Session中查找该客户的状态就可以了。
  • 如果说Cookie机制是通过检查客户身上的“通行证”来确定客户身份的话,那么Session机制就是通过检查服务器上的“客户明细表”来确认客户身份。Session相当于程序在服务器上建立的一份客户档案,客户来访的时候只需要查询客户档案表就可以了。
  • Session存储在服务器也有一定的弊端,就是会占用服务器的资源,但现在服务器已经发展至今,存储一些Session信息还是绰绰有余的。

3、Cookie工作原理图解

如下图所示:

提示:如果步骤5携带的是过期的cookie或者是错误的cookie,那么将认证失败,返回至要求身份认证页面。

记录Cookie的作用:

  1. 用户第一次登陆时,勾选下次直接登陆或者记住密码,就是采用记录Cookie实现的。
  2. Cookie内记录用户名和密码(加密)信息,只要请求时服务器收到Cookie,识别成功,默认为已登陆。

4、Cookie内容参数说明

参数 描述
name 必需。规定 Cookie的名称。
value 必需。规定 Cookie的值。
expire 可选。规定 Cookie的有效期。
domain 可选。规定 Cookie的域名。
path 可选。规定 Cookie的服务器路径。
secure 可选。规定是否通过安全的 HTTPS 连接来传输 Cookie。
httpOnly 可选。防止XSS攻击(跨站脚本攻击)

说明:

  • pathCookie的有效范围,这个参数是在domain参数基础上的有效范围,如果path设置为”/”,那就是在整个domain都有效。
  • secureCookie是否仅通过安全的https,值为0或1。如果值为1,则Cookie只能在https连接上有效,默认值为0,表示Cookiehttphttps连接上都有效。(0或1,也可表示Flase或True)
  • httpOnly:通过js脚本将无法读取到Cookie信息,这样能有效的防止XSS攻击(跨站脚本攻击),这样就增加了Cookie的安全性,即便是这样,也不要将重要信息存入Cookie

5、Selenium操作Cookie的API

webdriver可以读取、添加和删除Cookie信息。

webdriver操作Cookie的方法有:

操作 说明
get_cookies() 获得所有Cookie信息(重点)
add_cookie(cookie_dict) 添加Cookie,必须有name 和value 值(重点)
get_cookie(name值) 返回指定name名称的Cookie信息
delete_cookie(name) 删除特定(部分)的Cookie信息
delete_all_cookies() 删除所有Cookie信息

6、Selenium操作Cookie的示例

"""
1.学习目标:
    掌握selenium对cookie操作
2.语法
    2.1获取所有cookie
        driver.get.cookies()
        返同列表格式字典类型 [{},{},{}]
    2.2添加cookie
        driver.add_cookie(参数)
        参数:字典格式{"name":"name值","value":"value值"}
3.需求
    实现selenium对cookie操作
"""
# 1.导入selenium
from selenium import webdriver
from time import sleep

# 2.打开浏览器
driver = webdriver.Chrome()

# 3.打开注册A页面
# 不打开一个页面,cookie为[]。
url = "http://www.baidu.com/"
driver.get(url)

# 4.操作cookie
# 4.1 获取cookie
cookies = driver.get_cookies()
for cookie in cookies:
    # 值打印cookie中的name和value
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.2 获取一个cookie的指定属性值
# 参数是一个cookie中name的属性值
# 没有找到返回None
print(driver.get_cookie("BAIDUID"))

print("=======================")
# 4.3 添加cookie
cookie = {"name": "key-aaaaaaa", "value": "value-aaaaaaa"}
driver.add_cookie(cookie)

# 添加后再次获取
cookies = driver.get_cookies()
for cookie in cookies:
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.4 删除指定cookie
# 根据name删除
driver.delete_cookie("key-aaaaaaa")
# 删除后再次获取
cookies = driver.get_cookies()
for cookie in cookies:
    print("%s -> %s" % (cookie['name'], cookie['value']))

print("=======================")
# 4.5 删除全部cookie
driver.delete_all_cookies()
print(driver.get_cookies())

# 5.关闭浏览器
sleep(2)
driver.quit()

参考:https://www.cnblogs.com/linguoguo/p/5106618.html

到此这篇关于Selenium对Cookie的操作 的文章就介绍到这了,更多相关Selenium Cookie操作 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python删除列表中重复记录的方法

    python删除列表中重复记录的方法

    这篇文章主要介绍了python删除列表中重复记录的方法,涉及Python操作列表的相关技巧,需要的朋友可以参考下
    2015-04-04
  • 简单介绍Python虚拟环境及使用方法

    简单介绍Python虚拟环境及使用方法

    Python的虚拟环境极大地方便了人们的生活.本文介绍了虚拟环境的基础知识以及使用方法,文中有非常详细的说明,需要的朋友可以参考下
    2021-06-06
  • 在Python中关于使用os模块遍历目录的实现方法

    在Python中关于使用os模块遍历目录的实现方法

    今天小编就为大家分享一篇在Python中关于使用os模块遍历目录的实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python Flask自定义URL路由参数过滤器的方法详解

    Python Flask自定义URL路由参数过滤器的方法详解

    Flask是一个轻量级的Python Web应用框架,它允许开发者以一种简洁明了的方式来构建Web应用,Flask自定义URL的主要功能在于使得开发者能够通过简单的路由规则来自定义应用程序的URL结构,本文给大家介绍了Python Flask自定义URL路由参数过滤器的方法,需要的朋友可以参考下
    2024-07-07
  • Python通过四大 AutoEDA 工具包快速产出完美数据报告

    Python通过四大 AutoEDA 工具包快速产出完美数据报告

    在三年前,我们做数据竞赛或者数据建模类的项目时,前期我们会耗费较多的时间去分析数据,但现在非常多擅长数据分析的大师们已经将我们平时常看的数据方式进行了集成,开发了很多AutoEDA的工具包。可以帮助我们节省大量时间
    2021-11-11
  • Python深度学习pytorch神经网络多输入多输出通道

    Python深度学习pytorch神经网络多输入多输出通道

    这篇文章主要为大家介绍了Python深度学习中pytorch神经网络多输入多输出通道的详解有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2021-10-10
  • python Boltons库实用功能探索(深度复制类型检查重试机制)

    python Boltons库实用功能探索(深度复制类型检查重试机制)

    这篇文章主要为大家介绍了python Boltons库实用功能探索包含深度复制类型检查重试机制及数据结构转换实现示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • numpy中的高维数组转置实例

    numpy中的高维数组转置实例

    下面小编就为大家分享一篇numpy中的高维数组转置实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Python网络爬虫项目:内容提取器的定义

    Python网络爬虫项目:内容提取器的定义

    本篇文章主要介绍了Python网络爬虫项目,这能有效的节省程序员的时间,具有一定的参考价值,感兴趣的小伙伴们可以参考一下。
    2016-10-10
  • Tensorflow2.4从头训练Word Embedding实现文本分类

    Tensorflow2.4从头训练Word Embedding实现文本分类

    这篇文章主要为大家介绍了Tensorflow2.4从头训练Word Embedding实现文本分类,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-01-01

最新评论