python爬虫教程之爬取百度贴吧并下载的示例
测试url:http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4
import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
for i in range(begin_page, end_page+1):
sName = string.zfill(i,5)+ '.html'
print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
f = open (sName,'w+')
m = urllib2.urlopen(url + str(i)).read()
f.write(m)
f.close()
bdurl = str(raw_input('url: \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
相关文章
解决List.append() 在 Python 中不起作用的问题
在 Python 中,我们通常使用 List.append() 方法向列表末尾添加元素,然而,在某些情况下,你可能会遇到 List.append() 方法不起作用的问题,本文将详细讨论这个问题并提供解决方法,需要的朋友可以参考下2023-06-06如何基于Python + requests实现发送HTTP请求
这篇文章主要介绍了如何基于Python + requests实现发送HTTP请求,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下2020-01-01
最新评论