Python使用urllib模块对URL网址中的中文编码与解码实例详解

更新时间：2020年02月18日 15:28:42 作者：彭世瑜

这篇文章主要介绍了Python使用urllib模块对URL网址中的中文编码与解码(Python使用urllib模块对URL编码与解码)实例详解,需要的朋友可以参考下

URL网址链接中的中文编码说明

中文的gbk(GB2312)编码：一个汉字对应两组%xx，即%xx%xx

中文的UTF-8编码：一个汉字对应三组%xx，即%xx%xx%xx

可以利用百度进行URL编码解码默认gbk

https://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD

python3编码解码示例

# -*- coding: utf-8 -*-

# @File  : urldecode_demo.py
# @Date  : 2018-05-11

from urllib.request import quote, unquote

# 编码

url1 = "https://www.baidu.com/s?wd=中国"

# utf8编码，指定安全字符
ret1 = quote(url1, safe=";/?:@&=+$,", encoding="utf-8")
print(ret1)
# https://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD

# gbk编码
ret2 = quote(url1, encoding="gbk")
print(ret2)
# https%3A//www.baidu.com/s%3Fwd%3D%D6%D0%B9%FA


# 解码
url3 = "https://www.baidu.com/s?wd=%E4%B8%AD%E5%9B%BD"

ret3 = unquote(url3, encoding='utf-8')
print(ret3)
# https://www.baidu.com/s?wd=中国

实例中我们使用到了urllib模块和urllib.unquote()函数

import urllib
rawurl=xxx
url=urllib.unquote(rawurl)

所用模块：urllib

所用函数：urllib.unquote()

案例

import urllib
rawurl = "%E6%B2%B3%E6%BA%90"
url = urllib.unquote(rawurl)
print url

输出

河源

urllib.unquote()目的是对url编码进行解码，与该函数对应的是编码函数urllib.quote（）

>>> import urllib
>>> urllib.quote("河源")
'%E6%B2%B3%E6%BA%90

问题扩展

URL为何要编码、解码？

通常如果一样东西需要编码，说明这样东西并不适合传输。原因多种多样，如Size过大，包含隐私数据。对于Url来说，之所以要进行编码，是因为Url中有些字符会引起歧义。

例如，Url参数字符串中使用key=value键值对这样的形式来传参，键值对之间以&符号分隔，如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&，那么势必会造成接收Url的服务器解析错误，因此必须将引起歧义的&和=符号进行转义，也就是对其进行编码。

又如，Url的编码格式采用的是ASCII码，而不是Unicode，这也就是说你不能在Url中包含任何非ASCII字符，例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下，中文可能会造成问题。

更多关于Python使用urllib模块对URL编码与解码实例请查看下面的相关链接

您可能感兴趣的文章:

python反转单链表算法题
这篇文章主要为大家详细介绍了python反转单链表算法题，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2022-05-05
Python 日志记录模块的综合指南
这篇文章主要为大家介绍了Python 日志记录模块的综合指南,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-12-12
用Python3通过PyCharm上传代码到Git服务器的详细过程
上传代码到服务器,如果不知道的情况下还用传统的方式上传很麻烦,现在很多IDE都提供上传代码的功能,例如：VSCode,PyCharm等等,本文讲解的是PyCharm,需要的朋友可以参考下
2024-03-03
详解python3中zipfile模块用法
本篇文章给大家分享了关于python3中zipfile模块的详细用法以及技术难点解析，有兴趣的朋友跟着学习下吧。
2018-06-06
Python栈的实现方法示例【列表、单链表】
这篇文章主要介绍了Python栈的实现方法,结合实例形式分析了Python基于列表、单链表定义栈的相关操作技巧,需要的朋友可以参考下
2020-02-02
python点云地面点滤波(Progressive Morphological Filter)算法介绍（PCL库）
这篇文章主要介绍了python点云地面点滤波(Progressive Morphological Filter)算法介绍（PCL库）,了解膨胀/腐蚀这两个基础操作,可以通过对其进行简单组合来形成开/闭操作,需要的朋友可以参考下
2021-08-08
解决Python网页爬虫之中文乱码问题
今天小编就为大家分享一篇解决Python网页爬虫之中文乱码问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-05-05
python 拷贝特定后缀名文件,并保留原始目录结构的实例
下面小编就为大家分享一篇python 拷贝特定后缀名文件,并保留原始目录结构的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-04-04
基于Python编写一个解析器
这篇文章主要给大家介绍了如何基于Python编写一个解析器,文章通过代码示例介绍的非常详细,具有一定的参考价值,需要的朋友可以参考下
2023-08-08
python图片处理库Pillow实现简单PS功能
Python 届处理图片最强的库是 PIL(Python Image Library)，但由于该库只支持 2.x 版本，在此基础上做了扩展，出了一个兼容 3.x 的版本也就是 Pillow，因此，我们今天要用的库就是Pillow
2021-11-11