详解python的二进制转化模块
在pyton中,通过struct
模块来对二进制进行转换,主要包括两大类函数,即用于打包的pack和用于解包的unpack。
其中,struct.pack
的输入格式为struct.pack(format, v1, v2, ...)
,其中format
为格式字符串,v1,v2..
为将要转成bytes
的字符。
例如
>>> import struct >>> struct.pack('i', 15) b'\x0f\x00\x00\x00' >>> struct.pack('iii', 15, 16, 17) b'\x0f\x00\x00\x00\x10\x00\x00\x00\x11\x00\x00\x00' >>> struct.pack('b', 255) #b格式的取值范围是-128到127 struct.error: byte format requires -128 <= number <= 127 >>> struct.pack('B', 200) b'\xc8' >>> struct.pack('B', 71) #128以内可用ASCII表示 b'G'
i
代表int
,15对应的二进制代码为F000
,故其输出为b\x0f\x00\x00\x00
。当格式字符串为iii
时,说明要将三个数字以整数类型转化为二进制。
其中,格式化字符串中的每个字符都代表一种数据类型,其中整型相关的字符如下,左侧为带符号整型,右侧为无符号整型
C语言类型 | C语言类型 | 标准大小 | ||
---|---|---|---|---|
b | signed char | B | unsigned char | 1 |
h | short | H | unsigned short | 2 |
i | int | I | unsigned int | 4 |
l | long | L | unsigned long | 4 |
q | long long | Q | unsigned long long | 8 |
n | ssize_t | N | size_t |
其他类型
格式 | C 类型 | Python 类型 | 标准大小 |
---|---|---|---|
x | 填充字节 | 无 | |
c | char | 长度为1的字节串 | |
? | _Bool | bool | 1 |
e | float | 2 | |
f | float | float | 4 |
d | double | float | 8 |
s | char[] | 字节串 | |
p | char[] | 字节串 | |
P | void* | 整数 |
struct
中提供了获取标准大小的函数,calcsize
:
>>> struct.calcsize('B') 1 >>> struct.calcsize('i') 4
除了声明被格式化时的数据类型,struct
还可以指定对齐方式,例如
>>> struct.pack("i",15) b'\x0f\x00\x00\x00' >>> struct.pack(">i",15) #小端序 b'\x00\x00\x00\x0f' >>> struct.pack("<i",15) #大端序 b'\x0f\x00\x00\x00'
其对应字符的含义分别为
@ | = | < | > | ! |
---|---|---|---|---|
本机 | 本机 | 小端 | 大端 | 网络(大端) |
其中默认为@
,即本机字节顺序。
在熟悉了pack
之后,与之对偶的unpack
也就没啥难度了
>>> test = struct.pack("III",125,1255,12555) >>> struct.unpack("III",test) (125, 1255, 12555)
除了pack
和unpack
,struct
模块还提供了C语言风格的一对函数pack_into
和unpack_from
,二者的声明分别为
struct.pack_into(format, buffer, offset, v1, v2, ...) struct.unpack_from(format, /, buffer, offset=0)
其中buffer
表示缓冲流,在pack_into
中,将v1,v2...
以offset
的偏置打包入buffer
中;在unpack_from
中,将buffer
中的数据从offset
处依次取出。
struct
中封装了用于二进制处理的类Struct
,按照以往经验,其pack
函数的实现方法很有可能是下面这种
def pack(format,*args): return Struct(format).pack(args)
其中Struct
的初始化方法就是输入一个格式化字符串,例如
>>> s = struct.Struct("III") >>> s.pack(1,2,3) b'\x01\x00\x00\x00\x02\x00\x00\x00\x03\x00\x00\x00'
总结
本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注脚本之家的更多内容!
最新评论