Python使用execjs执行包含中文参数的JavaScript
抓取到了一段包含数据的JavaScript代码:
import re import requests headers = { "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36", "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9", } res = requests.get( "https://www.kuaikanmanhua.com/web/comic/100868/", headers=headers ) script = re.findall( "<script>window.__NUXT__=([^<]+);</script>", res.text)[0].replace('\\u002F', "/") script
结果:
这段代码直接在游览器执行可以得到对应的JSON数据,那么我们如何使用python执行这段代码获取JS数据呢?答案是使用execjs。
安装:
pip install PyExecJS
但是如果此时在安装过Nodejs的windows上直接执行代码:
import execjs execjs.eval(script)
会报出如下错误:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 447: illegal multibyte sequence
此时我们需要重新指定execjs的环境为JScript:
import os os.environ["EXECJS_RUNTIME"] = "JScript"
再次执行可以顺利得到结果。
如果我们确实需要使用本地nodejs的环境执行JavaScript则需要修改修改execjs的源码:
import os os.environ["EXECJS_RUNTIME"] = "Node" print(execjs.get().name)
Node.js (V8)
找到execjs安装目录下的_external_runtime.py
文件:
重启程序再次执行即可得到结果:
execjs的调用函数或读取变量示例:
import execjs ctx = execjs.compile(""" function add(x, y) { return x + y; } v = add(3, 4); """) print(ctx.call("add", 1, 2), ctx.eval("v"))
3 7
Lib\site-packages\execjs\runtime_names.py
文件可以看到execjs所支持的JavaScript环境:
PyV8 = "PyV8" Node = "Node" JavaScriptCore = "JavaScriptCore" SpiderMonkey = "SpiderMonkey" JScript = "JScript" PhantomJS = "PhantomJS" SlimerJS = "SlimerJS" Nashorn = "Nashorn"
总结
到此这篇关于Python使用execjs执行包含中文参数JavaScript的文章就介绍到这了,更多相关execjs执行包含中文参数js内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
Python实现读取HTML表格 pd.read_html()
这篇文章主要介绍了Python实现读取HTML表格 pd.read_html(),具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教2022-07-07python plt.plot bar 如何设置绘图尺寸大小
这篇文章主要介绍了python plt.plot bar 设置绘图尺寸大小的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教2021-06-06
最新评论