Python使用scrapy采集数据时为每个请求随机分配user-agent的方法

 更新时间:2015年04月08日 10:59:13   作者:pythoner  
这篇文章主要介绍了Python使用scrapy采集数据时为每个请求随机分配user-agent的方法,涉及Python使用scrapy采集数据的技巧,非常具有实用价值,需要的朋友可以参考下

本文实例讲述了Python使用scrapy采集数据时为每个请求随机分配user-agent的方法。分享给大家供大家参考。具体分析如下:

通过这个方法可以每次请求更换不同的user-agent,防止网站根据user-agent屏蔽scrapy的蜘蛛

首先将下面的代码添加到settings.py文件,替换默认的user-agent处理模块

复制代码 代码如下:
DOWNLOADER_MIDDLEWARES = {
    'scraper.random_user_agent.RandomUserAgentMiddleware': 400,
      'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None,
}

自定义useragent处理模块
复制代码 代码如下:
from scraper.settings import USER_AGENT_LIST
import random
from scrapy import log
class RandomUserAgentMiddleware(object):
    def process_request(self, request, spider):
        ua  = random.choice(USER_AGENT_LIST)
        if ua:
            request.headers.setdefault('User-Agent', ua)
        #log.msg('>>>> UA %s'%request.headers)

希望本文所述对大家的Python程序设计有所帮助。

相关文章

  • Python中不同进制互相转换(二进制、八进制、十进制和十六进制)

    Python中不同进制互相转换(二进制、八进制、十进制和十六进制)

    这篇文章主要介绍了Python中不同进制互相转换,本文讲解了二进制、八进制、十进制和十六进制的相与转换实现代码,需要的朋友可以参考下
    2015-04-04
  • pandas combine_first函数处理两个数据集重叠和缺失

    pandas combine_first函数处理两个数据集重叠和缺失

    combine_first是pandas中的一个函数,它可以将两个DataFrame对象按照索引进行合并,用一个对象中的非空值填充另一个对象中的空值,这个函数非常适合处理两个数据集有部分重叠和缺失的情况,可以实现数据的补全和更新,本文介绍combine_first函数的语法及一些案例应用
    2024-01-01
  • Python入门篇之正则表达式

    Python入门篇之正则表达式

    正则表达式是一个很有用的工具,可处理复杂的字符匹配和替换工作。在Python中内置了一个re模块以支持正则表达式。本文我们就来详细探讨下Python中正则表达式。
    2014-10-10
  • Mac中pyenv的安装与使用教程

    Mac中pyenv的安装与使用教程

    pyenv支持linux下python多版本的共存和版本之间切换,非常方便,下面这篇文章主要给大家介绍了关于Mac中pyenv安装与使用的相关资料,需要的朋友可以参考下
    2022-02-02
  • 用Anaconda安装本地python包的方法及路径问题(图文)

    用Anaconda安装本地python包的方法及路径问题(图文)

    这篇文章主要介绍了用Anaconda安装本地python包的方法及路径问题,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-07-07
  • python求众数问题实例

    python求众数问题实例

    这篇文章主要介绍了python求众数问题实例,包括文件的读写、字典的运用及数值的计算等技巧,需要的朋友可以参考下
    2014-09-09
  • 基于Python的图像数据增强Data Augmentation解析

    基于Python的图像数据增强Data Augmentation解析

    这篇文章主要介绍了基于Python的图像数据增强Data Augmentation解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • pytorch中的模型训练(以CIFAR10数据集为例)

    pytorch中的模型训练(以CIFAR10数据集为例)

    这篇文章主要介绍了pytorch中的模型训练(以CIFAR10数据集为例),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • Python3.9.1中使用match方法详解

    Python3.9.1中使用match方法详解

    这篇文章主要介绍了Python3.9.1中使用match方法详解,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-02-02
  • Python3.7实现验证码登录方式代码实例

    Python3.7实现验证码登录方式代码实例

    这篇文章主要介绍了Python3.7实现验证码登录方式代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02

最新评论