python抓取京东商城手机列表url实例代码

更新时间：2013年12月18日 15:25:21 作者：

python抓取京东商城手机列表url实例分享，大家参考使用吧

#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5

@author: good-temper
'''

import urllib2
import bs4
import time

def getPage(urlStr):
    '''
                获取页面内容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content

def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-页码-1-1-72-4137-33.html
    url = u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'

    #是否有下一页
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''

def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 = bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])

        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list

def analyzeContent(url):

return ''

def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()

if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'条\n'

    writeToFile(list, u'E:\\jd_phone_list.dat');

您可能感兴趣的文章:

python爬虫获取多页天涯帖子
本篇文章通过爬取多页天涯帖子内容来教给大家深入理解python爬虫相关知识，有兴趣的参考学习下。
2018-02-02
Jupyter Notebook/VSCode导出PDF中文不显示的解决
这篇文章主要介绍了Jupyter Notebook/VSCode导出PDF中文不显示的解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-06-06
对Python+opencv将图片生成视频的实例详解
今天小编就为大家分享一篇对Python+opencv将图片生成视频的实例详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-01-01
Python Pygame实战之打砖块小游戏
打砖块最早是由雅达利公司开发的一款独立游戏，也是无数人的童年记忆。本文将利用Python中的Pygame模块制作经典的打砖块游戏，需要的可以参考一下
2022-02-02
Python使用pandasai实现数据分析
本文主要介绍了Python使用pandasai实现数据分析，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-06-06
Python的面向对象思想分析
这篇文章主要介绍了Python的面向对象思想分析,以实例形式较为详细的分析了封装,继承,多态的具体用法,具有一定参考借鉴价值,需要的朋友可以参考下
2015-01-01
在python image 中安装中文字体的实现方法
今天小编大家分享一篇在python image 中安装中文字体的实现方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-08-08
Django实现翻页的示例代码
翻页是经常使用的功能，Django提供了翻页器。用Django的Paginator类实现，有需要了解Paginator类用法的朋友可参考。希望此文章对各位有所帮助
2021-05-05
Python用栈实现队列的基本操作
队列（Queue）和栈（Stack）是常见的数据结构,它们在计算机科学中有着广泛的应用,在Python中,可以使用列表（List）来实现栈,但要用栈来实现队列需要一些巧妙的操作,本文就给大家详细介绍一下Python中如何用栈实现队列,需要的朋友可以参考下
2023-11-11
Python写的贪吃蛇游戏例子
这篇文章主要介绍了Python写的贪吃蛇游戏例子,练手作品,又好玩又可以学到东西,需要的朋友可以参考下
2014-06-06