用Python下载一个网页保存为本地的HTML文件实例

 更新时间:2018年05月21日 14:26:06   作者:麦克斯韦的妖精  
今天小编就为大家分享一篇用Python下载一个网页保存为本地的HTML文件实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。

比如我们要下载山东大学新闻网的一个页面,该网页如下:

实现代码如下:

import urllib.request

def getHtml(url):
 html = urllib.request.urlopen(url).read()
 return html

def saveHtml(file_name, file_content):
 # 注意windows文件命名的禁用符,比如 /
 with open(file_name.replace('/', '_') + ".html", "wb") as f:
  # 写文件用bytes而不是str,所以要转码
  f.write(file_content)

aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"
html = getHtml(aurl)
saveHtml("sduview", html)

print("下载成功")

打开相应的目录可以看到这个网页已经被下载保存成功了

我们用浏览器打开这个网页文件如下

由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。

以上这篇用Python下载一个网页保存为本地的HTML文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 为何人工智能(AI)首选Python?读完这篇文章你就知道了(推荐)

    为何人工智能(AI)首选Python?读完这篇文章你就知道了(推荐)

    这篇文章主要介绍了为何人工智能(AI)首选Python,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-04-04
  • 详解Python正则表达式re模块

    详解Python正则表达式re模块

    这篇文章主要介绍了Python正则表达式re模块,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-03-03
  • python中dlib库的详细安装方法

    python中dlib库的详细安装方法

    这篇文章主要介绍了python之dlib库的详细安装方法,文中有非常详细的代码示例,对正在学习python的小伙伴们有很好的帮助,需要的朋友可以参考下
    2021-04-04
  • python编程冒泡排序法实现动图排序示例解析

    python编程冒泡排序法实现动图排序示例解析

    这篇文章主要介绍了python编程中如何使用冒泡排序法实现动图排序的示例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步
    2021-10-10
  • 基于OpenCV的仿射变换实现方法

    基于OpenCV的仿射变换实现方法

    这篇文章主要给大家介绍了关于基于OpenCV的仿射变换实现方法,仿射变换相当于将二维平面上的每个坐标点与一个2x3的矩阵相乘,得到新的坐标,而透视变换则是与3x3的矩阵相乘,需要的朋友可以参考下
    2024-01-01
  • pandas数据聚合与分组运算的实现

    pandas数据聚合与分组运算的实现

    本文主要介绍了pandas数据聚合与分组运算的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-01-01
  • Python自动安装第三方库的小技巧(pip使用详解)

    Python自动安装第三方库的小技巧(pip使用详解)

    很多朋友私信小编Python安装第三方库安装技巧,在这就不一一回复大家了,今天小编给大家分享一篇教程关于Python自动安装第三方库的小技巧,本文以安装plotly为例给大家详细讲解,感兴趣的朋友跟随小编一起看看吧
    2021-05-05
  • 新版pycharm配置运行参数的教程/pycharm2023

    新版pycharm配置运行参数的教程/pycharm2023

    这篇文章主要介绍了新版pycharm配置运行参数的教程/pycharm2023,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-01-01
  • 详解Python3.8+PyQt5+pyqt5-tools+Pycharm配置详细教程

    详解Python3.8+PyQt5+pyqt5-tools+Pycharm配置详细教程

    这篇文章主要介绍了Python3.8+PyQt5+pyqt5-tools+Pycharm配置详细教程,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2020-11-11
  • win32com操作word之Application&Documents接口学习

    win32com操作word之Application&Documents接口学习

    这篇文章主要为大家介绍了win32com操作word之Application&Documents接口学习,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-01-01

最新评论