Python chardet库识别编码原理解析

 更新时间:2020年02月18日 10:09:40   投稿:yaominghui  
这篇文章主要介绍了python chardet库识别编码原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了python chardet库识别编码原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

chardet库是python的字符编码检测器,能够检测出各种编码的类型,例如:

import chardet
import urllib.request
 
testdata = urllib.request.urlopen('http://m2.cn.bing.com/').read()
print(chardet.detect(testdata))

运行结果:

{'confidence': 0.99, 'encoding': 'utf-8'}

翻译一下就是:

{'精准度': 99%, 'encoding(编码形式)': 'utf-8'}

没见识到这个库之前所有编码纯属自己的记忆:

# unicode_escape
\u4e2d\u56fd
# gbk或者utf-8
\xd6\xd0\xb9\xfa
中国
# urlencode
%e4%b8%ad%e5%9b%bd
# Gb2312
%d6%d0%b9%fa

这些编码纯属需要眼睛辨认再去网上查找编码,现在发现了chardet这个库后方便了很多  

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python中list方法详解

    python中list方法详解

    list 是 Python 中的一种内置数据类型,代表一个可变的有序序列。list 类型的对象可以使用多个方法来操作和修改其中的元素。文中通过代码示例详细介绍了list的常用方法,感兴趣的同学可以参考阅读
    2023-04-04
  • python通过pip更新所有已安装的包实现方法

    python通过pip更新所有已安装的包实现方法

    下面小编就为的带来一篇python通过pip更新所有已安装的包实现方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-05-05
  • Python中Numpy模块使用详解

    Python中Numpy模块使用详解

    这篇文章主要介绍了Python中Numpy模块使用详解,NumPy是Python 的一个扩展程序库,支持大量的维度数组与矩阵运算。更多相关内容需要的朋友可以参考一下
    2022-07-07
  • 零基础小白多久能学会python

    零基础小白多久能学会python

    在本篇文章里小编给大家分享的是一篇关于零基础学python要多久的相关文章内容,有兴趣的朋友们可以跟着学习下。
    2020-06-06
  • Python面向对象实现数据分析的实例详解

    Python面向对象实现数据分析的实例详解

    这篇文章主要通过几个实例为大家详细介绍了Python面向对象实现数据分析的方法,文中的示例代码讲解详细,对我们学习Python有一定帮助,需要的可以参考一下
    2023-01-01
  • python检查字符串是否是正确ISBN的方法

    python检查字符串是否是正确ISBN的方法

    这篇文章主要介绍了python检查字符串是否是正确ISBN的方法,涉及Python针对字符串的相关操作技巧,需要的朋友可以参考下
    2015-07-07
  • 在Ubuntu中安装并配置Pycharm教程的实现方法

    在Ubuntu中安装并配置Pycharm教程的实现方法

    这篇文章主要介绍了在Ubuntu中安装并配置Pycharm教程的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 解读tf.keras.layers模块中的函数

    解读tf.keras.layers模块中的函数

    这篇文章主要介绍了tf.keras.layers模块中的函数,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02
  • Python实现socket非阻塞通讯功能示例

    Python实现socket非阻塞通讯功能示例

    这篇文章主要介绍了Python实现socket非阻塞通讯功能,结合实例形式分析了Python使用socket模块进行非阻塞通讯的原理、多线程及客户端、服务器端相关实现技巧,需要的朋友可以参考下
    2019-11-11
  • python并行设计的实现

    python并行设计的实现

    python中的并行设计可以显著增强程序处理大量数据或复杂计算的速度,通过使用threading、multiprocessing和concurrent.futures等库,开发者可以有效利用多核CPU的计算力,下面就来详细的介绍一下
    2024-09-09

最新评论