python获取指定网页上所有超链接的方法
更新时间:2015年04月04日 12:57:23 作者:令狐不聪
这篇文章主要介绍了python获取指定网页上所有超链接的方法,涉及Python使用urllib2模块操作网页抓取的技巧,非常具有实用价值,需要的朋友可以参考下
本文实例讲述了python获取指定网页上所有超链接的方法。分享给大家供大家参考。具体如下:
这段python代码通过urllib2抓取网页,然后通过简单的正则表达式分析网页上的全部url地址
import urllib2
import re
#connect to a URL
website = urllib2.urlopen(url)
#read html code
html = website.read()
#use re.findall to get all the links
links = re.findall('"((http|ftp)s?://.*?)"', html)
print links
希望本文所述对大家的python程序设计有所帮助。
相关文章
Python列表pop()函数使用实例详解
这篇文章主要介绍了Python列表pop()函数使用实例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-07-07
Python ORM框架之SQLAlchemy 的基础用法
这篇文章主要介绍了Python ORM框架之SQLAlchemy 的基础用法,ORM全称 Object Relational Mapping对象关系映射,更多详细内容需要的小伙伴课题参考下面文章介绍。希望对你的学习有所帮助
2022-03-03
利用Python抓取阿里云盘资源
相对于百度云盘,阿里云盘的下载不限速,以及大容量空间深受大家的喜爱。本文将通过Python实现抓取阿里云盘的资源,感兴趣的可以学习一下
2022-02-02
Anaconda彻底删除虚拟环境的正确方法
这篇文章主要给大家介绍了关于Anaconda彻底删除虚拟环境的正确方法,要在Anaconda中删除一个虚拟环境,可以按照本文以下步骤进行操作,需要的朋友可以参考下
2023-10-10
Python中的Pydantic序列化详解
这篇文章主要介绍了Python中的Pydantic序列化详解,Pydantic 是 Python 中一个高性能的数据验证和序列化库,它提供了一个简单而强大的方式来定义结构化的数据,并在应用程序的各个层次中使用这些数据,需要的朋友可以参考下
2023-10-10
python基础之并发编程(三)
这篇文章主要介绍了详解python的并发编程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2021-10-10
最新评论