Python中bytes和str的区别与联系详解

 更新时间:2022年05月05日 11:20:32   作者:斯曦巍峨  
Python3最重要的新特性之一是对字符串和二进制数据流做了明确的区,下面这篇文章主要给大家介绍了关于Python中bytes和str区别与联系的相关资料,需要的朋友可以参考下

Bytes和Str的区别

在Python3中,字符序列有两种类型:bytes和str。bytes类型是无符号的8位值(通常以ASCII码显式),而str类型是Unicode代码点(code point)。代码点指编码字符集中,字符所对应的数字。

a = b'hello world'
print(isinstance(a, bytes))
print(list(a))
print(a)
"""
True
[104, 101, 108, 108, 111, 32, 119, 111, 114, 108, 100]
b'hello world'
"""

a = 'hello world'
print(isinstance(a, str))
print(list(a))
print(a)
"""
True
['h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd']
hello world
"""

isinstance()方法可以判断对象的类型,例如这里用来判断是str还是bytes。

Python3对文本(str)和二进制数据(bytes)有着严格的区分,不能混用。

x = b'python'
y = b'java'
z = 'c++'
w = 'c'

print(x + y)
# b'pythonjava'
print(z + w)
# c++c
print(x + z)
# TypeError: can't concat str to bytes

print('python' == b'python')
# False

上述示例中str类型和bytes类型间使用=来比较是否相等不会报错,但是会返回False。

Bytes与Str间的转换

str类型和bytes类型间可以相互转换。

str到bytes的转换需要调用encode()方法。

bytes到str间的转换需要调用decode()方法。

x = b'python'
y = x.decode(encoding='utf-8')
z = y.encode(encoding='utf-8')
print(y)
print(z)
"""
python
b'python'
"""

可以观察到encode()和decode()方法都有一个encoding参数用来指定具体的编码规则。

读写文件的注意事项

当要将bytes类型写入到文件中时,必须指定mode=wb。读取二进制文件时可以指定mode=rb或者指定编码方式,使用后者时读出来的就不是bytes类型的字符序列了。

x = b'python'

# 错误示例
with open('data.bin', mode='w') as fp:
    fp.write(x)
# TypeError: write() argument must be str, not bytes

# 正确示例
with open('data.bin', mode='wb') as fp:
    fp.write(x)

# 读取二进制文件方式1
with open('data.bin', mode='rb') as fp:
    content = fp.read()
    print(content)
# python

# 读取二进制文件方式2
with open('data.bin', mode='r', encoding='utf-8') as fp:
    content = fp.read()
    print(content, type(content))
# python <class 'str'>

当读写Unicode数据时,只需要注意下编码方式即可,最好是显式的传递encoding参数。

x = '世界你好'

with open('data.txt', mode='w', encoding='utf-8') as fp:
    fp.write(x)

with open('data.txt', mode='r', encoding='utf-8') as fp:
    content = fp.read()
    print(content)
# 世界你好

# 错误示例,编码方式不对
with open('data.txt', mode='r', encoding='gbk') as fp:
    content = fp.read()
    print(content)
# 涓栫晫浣犲ソ

总结

到此这篇关于Python中bytes和str区别与联系的文章就介绍到这了,更多相关Python bytes和str区别内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 简单介绍Python中的几种数据类型

    简单介绍Python中的几种数据类型

    Python基本内置数据类型有很多种,比如:整型(数字)、字符串、元组、列表、字典和布尔类型,下面就来给大家详细介绍下
    2016-01-01
  • python根据开头和结尾字符串获取中间字符串的方法

    python根据开头和结尾字符串获取中间字符串的方法

    这篇文章主要介绍了python根据开头和结尾字符串获取中间字符串的方法,涉及Python操作字符串截取的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03
  • Python 中 Selenium 的 getAttribute() 函数详解

    Python 中 Selenium 的 getAttribute() 

    本文将解释如何使用Selenium的getAttribute()方法,getAttribute() 方法可以检索元素属性,例如锚标记的 href 属性, 该函数最初将尝试返回指定属性的值,感兴趣的朋友跟随小编一起看看吧
    2023-11-11
  • python 字典访问的三种方法小结

    python 字典访问的三种方法小结

    今天小编就为大家分享一篇python 字典访问的三种方法小结,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python实现狄克斯特拉算法

    python实现狄克斯特拉算法

    这篇文章主要为大家详细介绍了python实现狄克斯特拉算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • Pandas中批量替换字符的六种方法总结

    Pandas中批量替换字符的六种方法总结

    这篇文章主要为大家介绍了Pandas中实现批量替换字符的六种方法,文中的示例代码讲解详细,对我们学习或工作有一定帮助,需要的可以参考一下
    2022-03-03
  • Python3导入自定义模块的三种方法详解

    Python3导入自定义模块的三种方法详解

    这篇文章主要给大家介绍了关于Python3导入自定义模块的三种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧。
    2018-04-04
  • Python报错之如何解决matplotlib绘图中文显示成框框问题

    Python报错之如何解决matplotlib绘图中文显示成框框问题

    这篇文章主要介绍了Python报错之如何解决matplotlib绘图中文显示成框框问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • 详解基于python的图像Gabor变换及特征提取

    详解基于python的图像Gabor变换及特征提取

    这篇文章主要介绍了基于python的图像Gabor变换及特征提取,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2020-10-10
  • 详解numpy1.19.4与python3.9版本冲突解决

    详解numpy1.19.4与python3.9版本冲突解决

    这篇文章主要介绍了详解numpy1.19.4与python3.9版本冲突解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12

最新评论