使用Python保存网页上的图片或者保存页面为截图

更新时间：2016年03月05日 14:47:28 作者：j_akill

这篇文章主要介绍了使用Python保存网页上的图片或者保存页面为截图的方法,保存网页图片主要用到urllib模块,即简单的爬虫原理,需要的朋友可以参考下

Python保存网页图片
这个是个比较简单的例子，网页中的图片地址都是使用'http://。。。。.jpg'这种方式直接定义的。

使用前，可以先建立好一个文件夹用于保存图片，本例子中使用的文件夹是 d:\\pythonPath这个文件夹

代码如下：

# -*- coding: UTF-8 -*- 
import os,re,urllib,uuid 
 
#首先定义云端的网页,以及本地保存的文件夹地址 
urlPath='http://gamebar.com/' 
localPath='d:\\pythonPath' 
 
 
#从一个网页url中获取图片的地址，保存在 
#一个list中返回 
def getUrlList(urlParam): 
  urlStream=urllib.urlopen(urlParam) 
  htmlString=urlStream.read() 
  if( len(htmlString)!=0 ): 
    patternString=r'http://.{0,50}\.jpg' 
    searchPattern=re.compile(patternString) 
    imgUrlList=searchPattern.findall(htmlString) 
    return imgUrlList 
 
     
#生成一个文件名字符串  
def generateFileName(): 
  return str(uuid.uuid1()) 
 
   
#根据文件名创建文件  
def createFileWithFileName(localPathParam,fileName): 
  totalPath=localPathParam+'\\'+fileName 
  if not os.path.exists(totalPath): 
    file=open(totalPath,'a+') 
    file.close() 
    return totalPath 
   
 
#根据图片的地址，下载图片并保存在本地  
def getAndSaveImg(imgUrl): 
  if( len(imgUrl)!= 0 ): 
    fileName=generateFileName()+'.jpg' 
    urllib.urlretrieve(imgUrl,createFileWithFileName(localPath,fileName)) 
 
 
#下载函数 
def downloadImg(url): 
  urlList=getUrlList(url) 
  for urlString in urlList: 
    getAndSaveImg(urlString) 
     
downloadImg(urlPath)

保存的文件如下：

201635144749913.jpg (755×329)

网页的一部分保存为图片
主要思路是selenium+phantomjs(中文网页需要设置字体)+PIL切图

def webscreen():
  url = 'http://www.xxx.com'
  driver = webdriver.PhantomJS()
  driver.set_page_load_timeout(300)
  driver.set_window_size(1280,800)
  driver.get(url)
  imgelement = driver.find_element_by_id('XXXX')
  location = imgelement.location
  size = imgelement.size
  savepath = r'XXXX.png'
  driver.save_screenshot(savepath)
  im = Image.open(savepath)
  left = location['x']
  top = location['y']
  right = left + size['width']
  bottom = location['y'] + size['height']
  im = im.crop((left,top,right,bottom))
  im.save(savepath)

您可能感兴趣的文章:

Python Numpy库常见用法入门教程
这篇文章主要介绍了Python Numpy库常见用法,结合实例形式详细Fenix了Python numpy库基本功能、原理以及数组常见操作技巧,需要的朋友可以参考下
2020-01-01
想学python 这5本书籍你必看！
想学python，这5本书籍你必看！本文为大家推荐了学习python的5本书籍，5本经典书籍，感兴趣的小伙伴们可以参考一下
2018-12-12
matlab中二维插值函数interp2的使用详解
这篇文章主要介绍了matlab中二维插值函数interp2的使用详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-04-04
haskell实现多线程服务器实例代码
这篇文章主要介绍了haskell实现的多线程服务器，大家参考使用吧
2013-11-11
解决tensorflow/keras时出现数组维度不匹配问题
这篇文章主要介绍了解决tensorflow/keras时出现数组维度不匹配问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-06-06
Python图像文字识别详解(附实战代码)
这篇文章主要给大家介绍了关于Python图像文字识别的相关资料,本文介绍使用python进行图像的文字识别,将图像中的文字提取出来,可以帮助我们完成很多有趣的事情,需要的朋友可以参考下
2024-02-02
详解python数据结构之队列Queue
这篇文章主要介绍了python数据结构之队列Queue,文中有非常详细的代码示例,对正在学习python的小伙伴们有很好的帮助,需要的朋友可以参考下
2021-05-05
Python描述数据结构学习之哈夫曼树篇
这篇文章主要给大家介绍了关于Python描述数据结构学习之哈夫曼树篇的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-09-09
8个实用的Python程序你知道几个
这篇文章主要为大家详细介绍了8个实用的Python程序，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下，希望能够给你带来帮助<BR>
2022-02-02
python 输出所有大小写字母的方法
今天小编就为大家分享一篇python 输出所有大小写字母的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-01-01

使用Python保存网页上的图片或者保存页面为截图

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具