python3.7简单的爬虫实例详解
更新时间:2019年07月08日 11:05:02 作者:pascal1000
这篇文章主要介绍了python3.7简单的爬虫实例代码,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
python3.7简单的爬虫,具体代码如下所示:
#https://www.runoob.com/w3cnote/python-spider-intro.html #Python 爬虫介绍 import urllib.parse import urllib.request from http import cookiejar url = "http://www.baidu.com" response1 = urllib.request.urlopen(url) print("第一种方法") #获取状态码,200表示成功 print(response1.getcode()) #获取网页内容的长度 print(str(response1.read())) print(len(response1.read())) print("第二种方法") request = urllib.request.Request(url) #模拟Mozilla浏览器进行爬虫 request.add_header("user-agent","Mozilla/5.0") response2 = urllib.request.urlopen(request) print(response2.getcode()) print(len(response2.read())) print("第三种方法") cookie = cookiejar.CookieJar() #加入urllib2处理cookie的能力# opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie)) urllib.request.install_opener(opener) response3 = urllib.request.urlopen(url) print(response3.getcode()) print(len(response3.read())) print(cookie)
code: https://github.com/pascal19821003/python path: python/study/tutorial/pachong/1.py
总结
以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!
相关文章
服务器端jupyter notebook映射到本地浏览器的操作
这篇文章主要介绍了服务器端jupyter notebook映射到本地浏览器的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2020-04-04python3中超级好用的日志模块-loguru模块使用详解
loguru默认的输出格式是上面的内容,有时间、级别、模块名、行号以及日志信息,不需要手动创建 logger,直接使用即可,另外其输出还是彩色的,看起来会更加友好,这篇文章主要介绍了python3中超级好用的日志模块-loguru模块使用详解,需要的朋友可以参考下2022-11-11使用python requests模块发送http请求及接收响应的方法
用 python 编写 http request 消息代码时,建议用requests库,因为requests比urllib内置库更为简捷,requests可以直接构造get,post请求并发送,本文给大家介绍了使用python requests模块发送http请求及接收响应的方法,需要的朋友可以参考下2024-03-03简单利用conda安装tensorflow-gpu=2.2.0的过程及问题解决
这篇文章主要介绍了简单利用conda安装tensorflow-gpu=2.2.0,本文给大家详细分享问题记录及错误问题解决方案,需要的朋友可以参考下2023-01-01
最新评论