python爬虫教程之爬取百度贴吧并下载的示例

更新时间：2014年03月07日 10:00:26 作者：

这篇文章主要介绍了python爬取百度贴吧整个html文件下载到本地的示例,需要的朋友可以参考下

测试url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

import string ,urllib2

def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_page+1):
        sName = string.zfill(i,5)+ '.html'
        print '正在下载第' + str(i) + '个网页，并将其存储为' + sName + '..........'
        f = open (sName,'w+')
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input('url： \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))

baidu_tieba(bdurl,begin_page,end_page)

您可能感兴趣的文章:

Python如何利用正则表达式爬取网页信息及图片
这篇文章主要给大家介绍了关于Python如何利用正则表达式爬取网页信息及图片的相关资料，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2021-04-04
pygame 键盘事件的实践
本文主要介绍了pygame 键盘事件，文中通过示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-11-11
Python中关于面向对象中继承的详细讲解
面向对象编程 (OOP) 语言的一个主要功能就是“继承”。继承是指这样一种能力：它可以使用现有类的所有功能，并在无需重新编写原来的类的情况下对这些功能进行扩展
2021-10-10
Django自定义分页效果
这篇文章主要为大家详细介绍了Django自定义分页效果，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2017-06-06
python求质数列表的例子
今天小编就为大家分享一篇python求质数列表的例子，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-11-11
使用pytorch完成kaggle猫狗图像识别方式
今天小编就为大家分享一篇使用pytorch完成kaggle猫狗图像识别方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-01-01
解决List.append() 在 Python 中不起作用的问题
在 Python 中，我们通常使用 List.append() 方法向列表末尾添加元素，然而，在某些情况下，你可能会遇到 List.append() 方法不起作用的问题，本文将详细讨论这个问题并提供解决方法，需要的朋友可以参考下
2023-06-06
如何基于Python + requests实现发送HTTP请求
这篇文章主要介绍了如何基于Python + requests实现发送HTTP请求,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-01-01
盘点总结Python爬虫常用库(附官方文档)
在信息时代,数据是无处不在的宝藏,从网页内容、社交媒体帖子到在线商店的产品信息,互联网上存在着大量的数据等待被收集和分析,Python爬虫是一种强大的工具,用于从互联网上获取和提取数据
2023-11-11
python实现简单文件读写函数
这篇文章主要为大家详细介绍了python实现简单文件读写函数，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-02-02