一则python3的简单爬虫代码

更新时间：2014年05月26日 17:29:18 作者：

最近一直在学习Python，还有网络爬虫，于是就想起来把2者结合一下，所以就有了本文。

不得不说python的上手非常简单。在网上找了一下，大都是python2的帖子，于是随手写了个python3的。代码非常简单就不解释了，直接贴代码。

#test rdp
import urllib.request
import re<br>
#登录用的帐户信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登录地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data) 
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登录 
res = urllib.request.urlopen(url,postdata)
#取得页面html<br>strResult=(res.read().decode('utf-8'))
#用正则表达式取出所有A标签
p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')
for m in p.finditer(strResult):
    print (m.group(1))#group(1)是href里面的内容，group(2)是a标签里的文字

关于cookie、异常等处理看了一下，没有花时间去处理，毕竟只是想通过写爬虫来学习python。

您可能感兴趣的文章:

pandas ix &iloc &loc的区别
这篇文章主要介绍了pandas ix &iloc &loc的区别，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2019-01-01
Python: 传递列表副本方式
今天小编就为大家分享一篇Python: 传递列表副本方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-12-12
用python制作词云视频详解
这篇文章主要介绍了用python制作词云视频详解，原理解释清晰,代码详细,用于练习很适合,需要的朋友可以参考下
2021-04-04
python用TensorFlow做图像识别的实现
这篇文章主要介绍了python用TensorFlow做图像识别的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-04-04
Python Base64编码和解码操作
Base64 就是一种基于64个可打印字符来表示二进制数据的方法，这篇文章主要介绍了Python Base64编码和解码,需要的朋友可以参考下
2022-12-12
python的ImageTk.PhotoImage大坑及解决
这篇文章主要介绍了python的ImageTk.PhotoImage大坑及解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-11-11
使用python进行图像分类的实现步骤
图像分类与识别是计算机视觉中的重要任务,它可以帮助我们自动识别图像中的对象、场景或者特征,在本文中,我们将介绍使用python进行图像分类的实现步骤,感兴趣的小伙伴跟着小编一起来看看吧
2024-09-09
在python中利用KNN实现对iris进行分类的方法
今天小编就为大家分享一篇在python中利用KNN实现对iris进行分类的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-12-12
Python的面向对象编程方式学习笔记
Python深度具备面向对象编程语言所应有的特性,这里我们以类和方法为主,来整理一下Python的面向对象编程方式学习笔记:
2016-07-07
Python基础globlal nonlocal和闭包函数装饰器语法糖
这篇文章主要为大家介绍了Python基础globlal nonlocal和闭包函数装饰器语法糖示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪
2022-11-11

一则python3的简单爬虫代码

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具