爬虫代理的cookie如何生成运行

更新时间：2020年09月22日 09:17:32 作者：laical

这篇文章主要介绍了爬虫代理的cookie如何生成运行，帮助大家更好的理解和使用爬虫，感兴趣的朋友可以了解下

HTTP是用于互联网传输数据信息到本地的一种传送协议

我们在浏览器中输入输入关键词，会返回页面内容。这就是我们用浏览器向网站所在的服务器发送了一个请求，网站的服务器接收到这个请求后进行解析，然后把网页内容呈现出来。

有时候服务器网站会检测IP在一个时间段内的请求次数，如果过于频繁，就会拒绝服务，简称为封IP。

HTTP代理就是用别人的IP进行访问，进行IP伪装。

除非是访问网站或APP专用数据api接口，正常的HTTP请求都需要进行ua（User-Agent）优化，因为ua是浏览器标识，如果http请求没有ua，或ua太少，都会被网站运维统计异常的，ua越丰富分布就越真实。cookie最好是登陆获取的，一般访客的cookie，对方限制会比较严格，可以控制一个地区新访客的访问频率。另外反爬统计的js也要分析下，是不是做了机器人判断，有没有做窗口分辨率判断等。

生成cookie：

import os
import time
import zipfile

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import WebDriverWait


class GenCookies(object):
  USER_AGENT = open('useragents.txt').readlines()
  # www.16yun.cn 代理配置
  PROXY_HOST = 't.16yun.cn' # proxy or host
  PROXY_PORT = 31111 # port
  PROXY_USER = 'USERNAME' # username
  PROXY_PASS = 'PASSWORD' # password

def open(self):
    """
    打开网页输入用户名密码并点击
    :return: None
    """
    self.browser.delete_all_cookies()
    self.browser.get(self.url)
    username = self.wait.until(EC.presence_of_element_located((By.ID, 'loginName')))
    password = self.wait.until(EC.presence_of_element_located((By.ID, 'loginPassword')))
    submit = self.wait.until(EC.element_to_be_clickable((By.ID, 'loginAction')))
    username.send_keys(self.username)
    password.send_keys(self.password)
    time.sleep(1)
    submit.click()

  def password_error(self):
    """
    判断是否密码错误
    :return:
    """
    try:
      return WebDriverWait(self.browser, 5).until(
        EC.text_to_be_present_in_element((By.ID, 'errorMsg'), '用户名或密码错误'))
    except TimeoutException:
      return False

  def get_cookies(self):
    """
    获取Cookies
    :return:
    """
    return self.browser.get_cookies()

运行cookie：

API接口开始运行
* Running on http://0.0.0.0:5000/ (Press CTRL+C to quit)
Cookies生成进程开始运行
Cookies检测进程开始运行
正在生成Cookies 账号 180000000 密码 16yun
正在测试Cookies 用户名 180000000
Cookies有效 180000000

如果HTTP请求成功，HTTP的状态码会返回200且返回数据。当然其他HTTP其他状态码也有，403表示禁止访问，504服务器内部出错等等。

以上就是爬虫代理的cookie如何生成运行的详细内容，更多关于爬虫代理 cookie的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

Python学习之迭代器详解
这篇文章主要介绍了Python中的一个新的概念，那就是迭代器。迭代器的使用可以帮助我们提升代码的性能，接下来让我们深入了解一下迭代器吧
2022-04-04
python使用suds调用webservice接口的方法
今天小编就为大家分享一篇python使用suds调用webservice接口的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-01-01
详解Python如何在多层循环中使用break/continue
关于break/continue这两个关键字在平常的使用过程中一直比较迷糊。所以本文将详细讲讲Python如何在多层循环中使用break/continue，需要的可以参考一下
2022-05-05
通过python连接Linux命令行代码实例
这篇文章主要介绍了通过python连接Linux命令行代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-02-02
使用python爬虫实现网络股票信息爬取的demo
下面小编就为大家分享一篇使用python爬虫实现网络股票信息爬取的demo，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-01-01
Python的matplotlib绘图如何修改背景颜色的实现
这篇文章主要介绍了Python的matplotlib绘图如何修改背景颜色的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2019-07-07
一文带你掌握Python中多线程和线程池的使用方法
Python中的多线程和线程池是其强大的功能之一，可以让我们更加高效地利用CPU资源，提高程序的运行速度。本文将介绍Python中多线程和线程池的使用方法，并提供一些实用的案例供读者参考
2023-04-04
解决Python3.7.0 SSL低版本导致Pip无法使用问题
这篇文章主要介绍了解决Python3.7.0 SSL低版本导致Pip无法使用问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-09-09
django中url映射规则和服务端响应顺序的实现
这篇文章主要介绍了django中url映射规则和服务端响应顺序的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-04-04
python中的PywebIO模块制作一个数据大屏
这篇文章主要介绍了python中的PywebIO模块制作一个数据大屏，一个制作数据大屏的工具，非常的好用，100行的Python代码就可以制作出来一个完整的数据大屏，并且代码的逻辑非常容易理解,需要的朋友可以参考一下
2022-03-03

爬虫代理的cookie如何生成运行

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具