Python爬虫爬取一个网页上的图片地址实例代码

 更新时间:2018年01月16日 15:04:57   作者:powerpoint_2016  
这篇文章主要介绍了Python爬虫爬取一个网页上的图片地址实例代码,具有一定借鉴价值,需要的朋友可以参考下

本文实例主要是实现爬取一个网页上的图片地址,具体如下。

读取一个网页的源代码:

import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
print(getHtml(http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip))

利用正则表达式爬取一个网页上的图片地址:

import re
import urllib.request
def getHtml(url):
  html=urllib.request.urlopen(url).read()
  return html
def getImg(html):
  r=r'"thumbURL":"(http://img.+?\.jpg)"' #定义正则
  imglist=re.findall(r,html)
  return imglist
html=str(getHtml("http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%E5%A3%81%E7%BA%B8&ct=201326592&lm=-1&v=flip"))
print(getImg(html))

运行结果:

总结

以上就是本文关于Python爬虫爬取一个网页上的图片地址实例代码的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

相关文章

  • 用python写一个福字(附完整代码)

    用python写一个福字(附完整代码)

    大家好,本篇文章主要讲的是用python写一个福字(附完整代码),感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
    2022-01-01
  • Python 获得13位unix时间戳的方法

    Python 获得13位unix时间戳的方法

    本篇文章主要介绍了Python 获得13位unix时间戳的方法,非常具有实用价值,需要的朋友可以参考下
    2017-10-10
  • Python中的GIL全局解释器锁多线程编程的隐患剖析

    Python中的GIL全局解释器锁多线程编程的隐患剖析

    Python作为一门强大而灵活的编程语言,吸引了大量的开发者,然而,对于多线程编程来说,Python引入了一个概念——全局解释器锁(Global Interpreter Lock,简称GIL),它在一定程度上影响了多线程程序的性能,本文将深入探讨GIL的概念,它对多线程编程的影响以及如何处理与绕过它
    2023-10-10
  • Python基于动态规划算法解决01背包问题实例

    Python基于动态规划算法解决01背包问题实例

    这篇文章主要介绍了Python基于动态规划算法解决01背包问题,结合实例形式分析了Python动态规划算法解决01背包问题的原理与具体实现技巧,需要的朋友可以参考下
    2017-12-12
  • python client使用http post 到server端的代码

    python client使用http post 到server端的代码

    python client使用 http post 到server端的代码,供大家学习参考
    2013-02-02
  • python基础之单分派泛函数singledispatch

    python基础之单分派泛函数singledispatch

    这篇文章主要介绍了python基础之单分派泛函数singledispatch问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • Python数据类型转换实现方法

    Python数据类型转换实现方法

    这篇文章主要介绍了Python数据类型转换的实现,有时候,我们需要对数据内置的类型进行转换,数据类型的转换,一般情况下你只需要将数据类型作为函数名即可
    2022-12-12
  • pytorch Dropout过拟合的操作

    pytorch Dropout过拟合的操作

    这篇文章主要介绍了pytorch Dropout过拟合的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • 解决Pycharm 运行后没有输出的问题

    解决Pycharm 运行后没有输出的问题

    这篇文章主要介绍了解决Pycharm 运行后没有输出的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-02-02
  • python实现加密的方式总结

    python实现加密的方式总结

    这篇文章主要介绍了python实现加密的方式总结,文中给大家提到了python中加密的注意点,通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-01-01

最新评论