python爬虫将js转化成json实现示例

更新时间：2023年05月31日 10:06:20 作者：ponponon

这篇文章主要为大家介绍了python爬虫将js转化成json实现示例详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

正文

有一个优秀的库可以使用————demjson

示范链接

http://fcd.5173.com/commondat...

请求上面链接，会得到如下图的一个js文件

我们需要把这个js文件转成为dict，方便提取其中需要的字段（这在爬虫任务中非常常见）

失败的方法

传统方法

通常转js文件为dict的过程：

1.先通过切片掐头去尾，去掉头部的 “callarea(” 和尾部的 “)” 。

2.再次导入json这个库，使用loads,json.loads(resposne.text[9:-1]),实现json转dict。

但是，这个方法在这里行不通。

import requests
import json
url = 'http://fcd.5173.com/commondata/Category.aspx?type=area&cache=&id=20c8bbc1b9794fc98bd96859624d4769&jsoncallback=callarea'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36',
}
resposne = requests.get(url, headers=headers)
print(json.loads(resposne.text[9:-1]))

错误原因

js文件并不一定是json的超集，这此处的js文件key不包含双引号，value中的内容是单引号。

上诉方法行得通的前提是这个js需要时json的超集，key和value都由双引号包围。

天无绝人之路

通过demjson可以一步到位

import requests
import demjson
url = 'http://fcd.5173.com/commondata/Category.aspx?type=area&cache=&id=20c8bbc1b9794fc98bd96859624d4769&jsoncallback=callarea'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36',
}
resposne = requests.get(url, headers=headers)
for item in demjson.decode(resposne.text[9:-1]):
    id = item.get('id')
    name = item.get('name')
    print(id, name)

得到如下结果

写代码千万不要睡着了

以上就是python爬虫将js转化成json实现示例的详细内容，更多关于python将js转化成json的资料请关注脚本之家其它相关文章！

您可能感兴趣的文章:

python中CURL 和python requests的相互转换实现
本文主要介绍了python中CURL 和python requests的相互转换实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2023-03-03
python实现简单的tcp 文件下载
这篇文章主要介绍了python如何实现简单的tcp文件下载，帮助大家更好的理解和学习python，感兴趣的朋友可以了解下
2020-09-09
Python Django 数据库的相关操作详解
下面小编就为大家带来一篇django数据库的相关操作,小编觉得挺不错的，现在就分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2021-11-11
Python通过解析网页实现看报程序的方法
这篇文章主要介绍了Python通过解析网页实现看报程序的方法,比较实用的功能,需要的朋友可以参考下
2014-08-08
Python识别处理照片中的条形码
这篇文章主要介绍了Python识别处理照片中的条形码，帮助大家更好的利用python处理图片，提高办公效率，感兴趣的朋友可以了解下
2020-11-11
Python 列表 sort()函数使用实例详解
这篇文章主要介绍了Python 列表 sort()函数使用详解，本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
2023-07-07
Python多进程同步简单实现代码
这篇文章主要介绍了Python多进程同步简单实现代码,涉及Python基于Process与Lock模块运行进程与锁机制实现多进程同步的相关技巧,需要的朋友可以参考下
2016-04-04
Python字符串、整数、和浮点型数相互转换实例
今天小编就为大家分享一篇Python字符串、整数、和浮点型数相互转换实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-08-08
Python中range()与np.arange()的具体使用
本文主要介绍了Python中range()与np.arange()的具体使用，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2022-06-06
python将MongoDB里的ObjectId转换为时间戳的方法
这篇文章主要介绍了python将MongoDB里的ObjectId转换为时间戳的方法,涉及Python操作MongoDB及字符串转换的技巧,具有一定参考借鉴价值,需要的朋友可以参考下
2015-03-03

python爬虫将js转化成json实现示例

目录

正文

示范链接

失败的方法

传统方法

错误原因

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具