Python爬虫防封ip的一些技巧

更新时间：2020年08月06日 10:31:00 作者：小雨

这篇文章主要介绍了Python爬虫防封ip的一些技巧，对平时学习爬虫有所帮助，感兴趣的朋友可以了解下

在编写爬虫爬取数据的时候，因为很多网站都有反爬虫措施，所以很容易被封IP，就不能继续爬了。在爬取大数据量的数据时更是瑟瑟发抖，时刻担心着下一秒IP可能就被封了。

本文就如何解决这个问题总结出一些应对措施，这些措施可以单独使用，也可以同时使用，效果更好。

伪造User-Agent

在请求头中把User-Agent设置成浏览器中的User-Agent，来伪造浏览器访问。比如：

headers ={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'} resp = requests.get(url,headers = headers)

还可以先收集多种浏览器的User-Agent，每次发起请求时随机从中选一个使用，可以进一步提高安全性：

把上面随机选择一个User-Agent的代码封装成一个函数：

在每次重复爬取之间设置一个随机时间间隔

比如：

time.sleep(random.randint(0,3)) # 暂停0~3秒的整数秒，时间区间：[0,3]

或：

time.sleep(random.random()) # 暂停0~1秒，时间区间：[0,1)

伪造cookies

若从浏览器中可以正常访问一个页面，则可以将浏览器中的cookies复制过来使用，比如：

注：用浏览器cookies发起请求后，如果请求频率过于频繁仍会被封IP，这时可以在浏览器上进行相应的手工验证（比如点击验证图片等），然后就可以继续正常使用该cookies发起请求。

使用代理

可以换着用多个代理IP来进行访问，防止同一个IP发起过多请求而被封IP，比如：

附：GitHub上的一个"反反爬虫"项目

道高一尺魔高一丈，你有反爬虫措施，那我也有各种"反反爬虫"的措施，GitHub上就有一位大神专门整理了一个这样的项目：Anti-Anti-Spider，链接地址为：github.com/luyishisi/An可以研究一下。

以上就是Python爬虫防封ip的一些技巧的详细内容，更多关于Python爬虫防封ip的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

python注释和运算符详解
这篇文章主要为大家介绍了python注释和运算符，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助
2021-12-12
python如何读取bin文件并下发串口
这篇文章主要介绍了python如何读取bin文件并下发串口,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2019-07-07
python+pyhyper实现识别图片中的车牌号思路详解
最近领导给布置了一个基于图片识别车牌号的工具开发任务，然后就去研究实现逻辑，自己根据opencv写了一个小demo，发现不仅速度慢而且成功率极低。然后，就找到了Hyperlpr开源项目，这篇文章主要介绍了python+pyhyper实现识别图片中的车牌号,需要的朋友可以参考下
2022-12-12
python在windows和linux下获得本机本地ip地址方法小结
这篇文章主要介绍了python在windows和linux下获得本机本地ip地址方法,实例分析了Python获得IP地址的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-03-03
Python使用Numpy模块读取文件并绘制图片
这篇文章主要介绍了Python使用Numpy模块读取文件并绘制图片,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-05-05
python可变对象,不可变对象详解
这篇文章主要介绍了Python可变对象和不可变对象的相关资料,文中讲解非常细致，代码帮助大家更好的理解和学习，感兴趣的朋友可以了解下
2021-09-09
利用Python获取操作系统信息实例
作为一个运维人员，经常需要获取系统的的各种信息，使用python会很方便帮助获得，这篇文章运用实例告诉大家如何利用Python来获取操作系统的信息，有需要的可以参考借鉴。
2016-09-09
jupyter notebook 添加kernel permission denied的操作
这篇文章主要介绍了jupyter notebook 添加kernel permission denied的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-04-04
python3.6.3安装图文教程 TensorFlow安装配置方法
这篇文章主要为大家详细介绍了python3.6.3及TensorFlow安装配置方法图文教程，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-09-09
python两种获取剪贴板内容的方法
这篇文章主要介绍了python两种获取剪贴板内容的方法，帮助大家更好的理解和使用python，完成需求，感兴趣的朋友可以了解下
2020-11-11

Python爬虫防封ip的一些技巧

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具