一篇文章搞懂Python反斜杠的相关问题

 更新时间:2021年03月20日 09:23:25   作者:ai52learn  
这篇文章主要给大家介绍了如何通过一篇文章搞懂Python反斜杠的相关问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

大家在开发Python的过程中,一定会遇到很多反斜杠的问题,很多人被反斜杠的数量搞得头大。

首先我们写一段非常简单的Python代码,它的作用是把一个字段先转换为JSON格式的字符串,然后把这个字符串再转换为JSON格式的字符串:

import json
 
info = {'name': 'kingname', 'address': '杭州', 'salary': 99999}
info_json = json.dumps(info)
 
# 第一次转换以后,打印出来
print(info_json)
 
info_json_json = json.dumps(info_json)
 
# 第二次转换以后,再打印出来
print(info_json_json)

它的运行效果如下图所示。

图片

第一次,字典转成JSON格式的字符串,只有中文杭州变成了Unicode编码\u676d\u5dde,其余地方没有出现反斜杠。

在Python里面,反斜杠不能单独出现,这里\u676d\u5dde中的两根反斜杠,实际上应该是\u。表示这两个编码是Unicode编码。

接下来,把第一次生成的JSON字符串:{"name": "kingname", "address": "\u676d\u5dde", "salary": 99999}再一次转成JSON格式的字符串,这一次变成了:

"{\"name\": \"kingname\", \"address\": \"\\u676d\\u5dde\", \"salary\": 99999}"

为什么突然出现了这么多反斜杠?这是因为,JSON格式的字符串本身是使用双引号来表示字符串的。如果原来的字符串里面本身就有双引号,那就会导致混淆。此时,Python需要把原来字符串的双引号变成普通的字符,失去双引号的作用。因此使用\"让双引号变成普通的字符。

这就相当于在Python中,可以这样定义一个包含双引号的字符串:

>>> a = "跟我说:\"你好\""
>>> print(a)
跟我说:"你好"

这里,你好两侧的双引号都加上了反斜杠,让它成为普通的字符,防止它们提前与最外层的双引号配对。

如果不加反斜杠,就会导致字符串里面的双引号提前与外层的双引号配对,引起语法错误:

>>> b = "跟我说:"你好""
  File "<stdin>", line 1
    b = "跟我说:"你好""
               ^
SyntaxError: invalid syntax

这里,"跟我说:"成为了一个字符串,末尾的""成为了一个空字符串。那么中间的你好就变成了一个没有定义的变量。而Python里面,是不存在字符串未定义的变量字符串这种写法的,所以会报语法错误。

而JSON格式的字符串,本质上也是字符串,所以自然而然也需要遵循这样的规则。因此,字符串原来自带的双引号左侧就被加上了反斜杠。

那么,原来的\u676d\u5dde为什么变成了\\u676d\\u5dde

这是因为,当第二次执行json.dumps的时候,传入的参数是一个JSON格式的字符串,本质就是字符串。而一个字符串里面如果自带反斜杠,那么JSON在对他再次转换的时候,需要标记这是一个普通的字符串形式的反斜杠,不是一个有特殊意义的反斜杠,所以使用\\表示一个普通的反斜杠。

好了,那么你可以猜一下,如果把info_json_jsonjson.dumps一下会怎么样?

会变成:

"\"{\\\"name\\\": \\\"kingname\\\", \\\"address\\\": \\\"\\\\u676d\\\\u5dde\\\", \\\"salary\\\": 99999}\""

为什么出现了三个反斜杠连用和四个反斜杠连用的问题?

实际上非常简单,当你对info_json_json执行json.dumps的时候,Python是怎么转换的?

我们来看:

"{\"name\": \"kingname\", \"address\": \"\\u676d\\u5dde\", \"salary\": 99999}"

字符串执行json.dumps的时候,记住一个关键方法——从左到右,一个字符一个字符的转换。

1. 第一个字符是双引号,所以变成\"
2. 第二个字符是{,不是特殊符号,保留
3. 第三个字符是\,把它变成\\
4. 第四个字符是",把它变成\"
5. ……

全部执行完成了,由于这次转换是把一个字符串转换为JSON格式的字符串,所以最外侧加上双引号。

于是就得到了:

"\"{\\\"name\\\": \\\"kingname\\\", \\\"address\\\": \\\"\\\\u676d\\\\u5dde\\\", \\\"salary\\\": 99999}\""

我们在爬虫开发过程中,可能会遇到上面这种经过多次JSON转换后的字符串,此时,千万不要轻易使用字符串的.replace方法把多个反斜杠替换为空或者把两个反斜杠替换为一个反斜杠。那样做只会导致你的数据更难解析。

正确的做法应该是尝试对数据一层一层使用json.loads,把它一层一层还原,还原到最初的{'name': 'kingname', 'address': '杭州', 'salary': 99999}这种简单形式。

好了,今天的介绍就到这里,最后留一个思考题:

还是上面的代码,现在把PyCharm的调试模式打开,然后数一数info_jsoninfo_json_json里面反斜杠的个数,如下图所示:

图片

为什么在info_json里面,出现了\\u676d\\u5dde,为什么在info_json_json里面双引号前是两根反斜杠,而\"\\u676d\\u5dde\"竟然变成了\\"\\\\u676d\\\\u5dde

总结

到此这篇关于一篇文章搞懂Python反斜杠的文章就介绍到这了,更多相关Python反斜杠内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python利用Charles 实现全部自动答题思路流程分析

    Python利用Charles 实现全部自动答题思路流程分析

    这篇文章主要介绍了Python利用Charles 实现全部自动答题思路流程分析,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-08-08
  • 深入浅析Python 函数注解与匿名函数

    深入浅析Python 函数注解与匿名函数

    这篇文章主要介绍了Python 函数注解与匿名函数的相关知识,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • pycharm 复制代码出现空格的解决方式

    pycharm 复制代码出现空格的解决方式

    这篇文章主要介绍了pycharm 复制代码出现空格的解决方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • Python不支持 i ++ 语法的原因解析

    Python不支持 i ++ 语法的原因解析

    这篇文章主要介绍了Python不支持 i ++ 语法的原因解析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-07-07
  • 详解如何使用Python实现复制粘贴的功能

    详解如何使用Python实现复制粘贴的功能

    pandas 里面有一个 pd.read_clipboard 函数,可以根据你复制的内容生成DataFrame。本文就利用这个函数实现复制粘贴的功能,感兴趣的可以了解一下
    2023-01-01
  • python 中文字符串的处理实现代码

    python 中文字符串的处理实现代码

    python中直接将一个中文字符串赋值给一个变量使用的是utf-8格式的编码,以下为证.
    2009-10-10
  • python实现微信跳一跳辅助工具步骤详解

    python实现微信跳一跳辅助工具步骤详解

    这篇文章主要介绍了python实现微信跳一跳辅助工具的步骤详解以及使用说明,需要的朋友可以参考下
    2018-01-01
  • Python requests模块cookie实例解析

    Python requests模块cookie实例解析

    这篇文章主要介绍了Python requests模块cookie实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • Python实现WGS84火星百度及web墨卡托四种坐标系相互转换

    Python实现WGS84火星百度及web墨卡托四种坐标系相互转换

    主流被使用的地理坐标系并不统一,常用的有WGS84、GCJ02(火星坐标系)、BD09(百度坐标系)以及百度地图中保存矢量信息的web墨卡托,本文利用Python编写相关类以实现4种坐标系统之间的互相转换
    2023-08-08
  • 如何使用 Python Timedelta 月份计算日期

    如何使用 Python Timedelta 月份计算日期

    在本篇文章中,我们将通过 timedelta 学习如何在 Python 中使用日期时间, 我们将了解如何计算当前日期或任何其他日期六个月后的日期,本文通过示例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧
    2023-10-10

最新评论