python爬虫爬取淘宝商品信息

更新时间：2018年02月23日 17:04:40 作者：OliverkingLi

这篇文章主要为大家详细介绍了python爬虫爬取淘宝商品信息，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

本文实例为大家分享了python爬取淘宝商品的具体代码，供大家参考，具体内容如下

import requests as req 
import re 
 
def getHTMLText(url): 
 try: 
 r = req.get(url, timeout=30) 
 r.raise_for_status() 
 r.encoding = r.apparent_encoding 
 return r.text 
 except: 
 return "" 
 
def parasePage(ilt, html): 
 try: 
 plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"', html) 
 tlt = re.findall(r'\"raw_title\"\:\".*?\"', html) 
 for i in range(len(plt)): 
  price = eval(plt[i].split(':')[1]) 
  title = eval(tlt[i].split(':')[1]) 
  ilt.append([price, title]) 
 except: 
 print("") 
 
 
def printGoodsList(ilt): 
 tplt = "{:4}\t{:8}\t{:16}" 
 print(tplt.format("序列号", "价格", "商品名称")) 
 count = 0 
 for j in ilt: 
 count = count + 1 
 print(tplt.format(count, j[0], j[1])) 
 
def main(): 
 goods = "python爬虫" 
 depth = 3 
 start_url = 'https://s.taobao.com/search?q=' + goods 
 infoList = [] 
 for i in range(depth): 
 try: 
  url = start_url + '&s=' + str(44*i) 
  html = getHTMLText(url) 
  parasePage(infoList, html) 
 except: 
  continue 
 printGoodsList(infoList) 
 
main()

效果图：

更多内容请参考专题《python爬取功能汇总》进行学习。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

python实现静态服务器
这篇文章主要为大家详细介绍了python实现静态服务器，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2019-09-09
Python中PySide2的安装及配置
在python中，支持图形化界面开发的库有很多，今天主要介绍一下PySide2这个库。具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-07-07
Python 命令行参数sys.argv
命令行参数是通过sys.argv[]来获取的，sys.argv[0]是代码文件本身的路径，因此参数是从1开始的。比如设置参数为： spe
2008-09-09
python 重命名轴索引的方法
今天小编就为大家分享一篇python 重命名轴索引的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-11-11
Python实现从百度API获取天气的方法
这篇文章主要介绍了Python实现从百度API获取天气的方法,实例分析了Python操作百度API的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-03-03
VSCODE配置Markdown及Markdown基础语法详解
这篇文章主要介绍了VSCODE配置Markdown及Markdown基础语法详解,本文给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-01-01
Python中进行表单处理的方法详解
这篇文章主要为大家详细介绍了Python中进行表单处理的方法,分别是利用Flask和Flask-WTF处理表单,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
2023-12-12
Python获取当前时间日期的方法总结
在Python编程中,获取当前的日期和时间是一个常见的需求,它在许多应用中都有重要作用,本文为大家详细整理了一些Python中的常用方法,希望对大家有所帮助
2024-01-01
Pycharm保存不能自动同步到远程服务器的解决方法
今天小编就为大家分享一篇Pycharm保存不能自动同步到远程服务器的解决方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-06-06
浅谈如何重构冗长的Python代码
这篇文章主要介绍了浅谈如何重构冗长的Python代码,编写干净的 Pythonic 代码就是尽可能使其易于理解，但又简洁,过长的代码如何做到简洁高效,需要的朋友可以参考下
2023-04-04

python爬虫爬取淘宝商品信息

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具