Cpython3.9源码解析python中的大小整数

 更新时间:2023年04月21日 10:14:09   作者:菜鸟小超  
这篇文章主要介绍了Cpython3.9源码解析python中的大小整数,在CPython中,小整数对象池是一种优化机制,用于减少对常用小整数的内存分配和销毁开销,需要的朋友可以参考下

小整数

/* interpreter state */

#define _PY_NSMALLPOSINTS           257
#define _PY_NSMALLNEGINTS           5

这是CPython中定义的两个常量,它们用于控制解释器状态中的小整数对象池。在CPython中,小整数对象池是一种优化机制,用于减少对常用小整数的内存分配和销毁开销。

_PY_NSMALLPOSINTS定义了正小整数对象池的大小。在这里,其值设置为257,表示解释器将为从0到256(包含0和256)的整数预分配对象并缓存。这些整数在很多场景下会被频繁使用,所以事先创建并缓存它们可以提高性能。

_PY_NSMALLNEGINTS定义了负小整数对象池的大小。在这里,其值设置为5,表示解释器将为从-1到-5(包含-1和-5)的整数预分配对象并缓存。

在Python解释器启动时,这些小整数对象会被创建并放入对象池。当需要这些整数值时,解释器会直接从对象池中获取对应的对象,而不是动态创建新对象。这样,对于这些小整数值的操作可以更快地进行,节省了内存分配和销毁的开销。

static PyObject *
get_small_int(sdigit ival)
{
    assert(IS_SMALL_INT(ival));
    PyThreadState *tstate = _PyThreadState_GET();
    PyObject *v = (PyObject*)tstate->interp->small_ints[ival + NSMALLNEGINTS];
    Py_INCREF(v);
    return v;
}

typedef int32_t sdigit; /* signed variant of digit */

#define IS_SMALL_INT(ival) (-NSMALLNEGINTS <= (ival) && (ival) < NSMALLPOSINTS)

这是get_small_int函数的实现,它用于从小整数对象池中获取一个指定值的小整数对象。小整数对象池包含了一定范围内的整数对象,主要是为了避免对这些常用的整数对象进行频繁的内存分配和销毁。

get_small_int函数接受一个sdigit类型的参数ival,表示要获取的整数值。在函数内部,首先使用assert(IS_SMALL_INT(ival))确保传入的整数值ival在小整数对象池的范围内。

接下来,函数获取当前线程状态(PyThreadState)并从其中获取解释器状态(tstate->interp)。解释器状态包含了小整数对象池,即small_ints数组

然后,根据ival计算出在small_ints数组中的索引(ival + NSMALLNEGINTS),并将对应位置的对象赋值给vNSMALLNEGINTS是一个宏定义,表示负小整数的个数。假设我们有一个整数值 ival,我们想要在 small_ints 数组中查找这个值对应的预分配的小整数对象。NSMALLNEGINTS 是预分配的负数的数量。在 CPython 中,NSMALLNEGINTS 的值通常为5,表示有5个预分配的负整数对象(-1, -2, -3, -4, -5)。

现在,我们将通过计算 ival + NSMALLNEGINTS 来找到 small_ints 数组中的索引。例如,假设 ival 为3。那么,我们可以计算索引如下:

index = ival + NSMALLNEGINTS
index = 3 + 5
index = 8

这意味着 small_ints 数组中的第8个元素(从0开始计数)是我们要查找的整数对象。在这个例子中,我们将找到预分配的小整数对象3,并将其引用计数加1,然后返回这个对象。

接下来,通过调用Py_INCREF(v)增加v的引用计数,以防止对象在其引用计数变为0时被错误地回收。

最后,返回指向小整数对象的指针v

总之,get_small_int函数的作用是从小整数对象池中获取一个指定值的小整数对象,并增加其引用计数,然后返回该对象。这样可以提高对常用小整数的操作性能。

大整数

/* Long integer representation.
   The absolute value of a number is equal to
        SUM(for i=0 through abs(ob_size)-1) ob_digit[i] * 2**(SHIFT*i)
   Negative numbers are represented with ob_size < 0;
   zero is represented by ob_size == 0.
   In a normalized number, ob_digit[abs(ob_size)-1] (the most significant
   digit) is never zero.  Also, in all cases, for all valid i,
        0 <= ob_digit[i] <= MASK.
   The allocation function takes care of allocating extra memory
   so that ob_digit[0] ... ob_digit[abs(ob_size)-1] are actually available.

   CAUTION:  Generic code manipulating subtypes of PyVarObject has to
   aware that ints abuse  ob_size's sign bit.
*/

这是CPython源码中关于长整数表示的一段注释。它解释了PyLongObject如何表示大整数的绝对值和符号。让我们逐行分析这个注释:

1.首先,注释指出大整数的绝对值等于:

SUM(for i=0 through abs(ob_size)-1) ob_digit[i] * 2**(SHIFT*i)

ob_digit表示长整数的每个“数字”,SHIFT是每个“数字”的位数,通常为30或15。ob_size表示长整数的符号和长度,它的绝对值表示长整数的长度,即“数字”的个数。

2.对于负数,ob_size小于0。对于0,ob_size等于0。

3.在规范化的数中,最高有效位(即最高“数字”)永远不会为零。此外,在所有情况下,对于所有有效的i,ob_digit[i]的取值范围在0到MASK之间。MASK的值通常为(1 << PyLong_SHIFT) - 1,即2**PyLong_SHIFT - 1

4.注释还提到分配函数负责分配额外的内存,以确保ob_digit[0]ob_digit[abs(ob_size)-1]实际上是可用的。

5.最后,注释中的“警告”部分提醒开发者,操纵PyVarObject子类型的通用代码需要注意整数会滥用ob_size的符号位。这是因为ob_size的符号位同时表示整数的长度和符号,而通常情况下ob_size仅用于表示长度。

额外解释

ob_digit 是一个表示大整数中每个 “数字” 的数组,它是一个整数数组,用于表示长整数对象(PyLongObject)中的整数值。每个 “数字” 都有一个固定的位数,由 PyLong_SHIFT 定义(通常为 30 或 15)。例如,假设我们有一个长整数对象,其值为 12345678901234567890。

在这个例子中,假设 PyLong_SHIFT 为 30,这意味着每个 “数字” 可以表示 2^30 = 1073741824 个不同的值。为了将这个大整数表示为 ob_digit 数组,我们需要将整数拆分为基于 2^30 的 “数字”。在这种情况下,我们可以将整数表示为:

12345678901234567890 = 4 * 2^(30*2) + 726238597 * 2^(30*1) + 1026062870 * 2^(30*0)

所以,ob_digit 数组将包含以下元素:

ob_digit[0] = 1026062870
ob_digit[1] = 726238597
ob_digit[2] = 4

在实际的 CPython 源码中,PyLongObject 的定义如下:

typedef struct {
    PyObject_VAR_HEAD
    digit ob_digit[1];
} PyLongObject;

在这里,ob_digit 是一个长度为1的数组,但实际上,它是一个可变长度数组,根据所需的 “数字” 数量动态分配。要注意的是,当一个 PyLongObject 被创建时,会根据整数值的大小动态分配适当数量的空间来存储 ob_digit 数组。

总之,ob_digit 是一个整数数组,用于表示长整数对象中的大整数值。每个数组元素都是一个 “数字”,具有固定的位数。这种表示方法使得 CPython 能够有效地存储和处理大整数。

到此这篇关于Cpython3.9源码解析python中的大小整数的文章就介绍到这了,更多相关Cpython3.9源码解析大小整数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python实现通过代理服务器访问远程url的方法

    python实现通过代理服务器访问远程url的方法

    这篇文章主要介绍了python实现通过代理服务器访问远程url的方法,涉及Python使用urllib模块操作URL的相关技巧,非常具有实用价值,需要的朋友可以参考下
    2015-04-04
  • Python并行编程多线程锁机制Lock与RLock实现线程同步

    Python并行编程多线程锁机制Lock与RLock实现线程同步

    这篇文章主要为大家介绍了Python并行编程多线程锁机制Lock与RLock实现线程同步示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-07-07
  • Python+Django实现接口测试工具的示例代吗

    Python+Django实现接口测试工具的示例代吗

    本文主要介绍了Python+Django实现接口测试工具,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-07-07
  • 使用Python进行同期群分析(Cohort Analysis)

    使用Python进行同期群分析(Cohort Analysis)

    同期群(Cohort)的字面意思(有共同特点或举止类同的)一群人,比如不同性别,不同年龄。这篇文章主要介绍了用Python语言来进行同期群分析,感兴趣的同学可以阅读参考一下本文
    2023-03-03
  • Python基于Flask框架配置依赖包信息的项目迁移部署

    Python基于Flask框架配置依赖包信息的项目迁移部署

    这篇文章主要介绍了Python基于Flask框架配置依赖包信息的项目迁移部署小技巧,非常不错,具有参考借鉴价值,需要的朋友可以参考下
    2018-03-03
  • Python tkinter如何设置背景颜色

    Python tkinter如何设置背景颜色

    本文主要介绍了Python的tkinter库中设置组件背景颜色的方法,主要通过使用bg选项和config方法来实现,包括设置单个组件、窗口、按钮、文本框以及整个应用的背景颜色,同时也可以使用十六进制颜色代码进行更精确的颜色控制
    2024-09-09
  • Python写一个简单的在线编辑器

    Python写一个简单的在线编辑器

    这篇文章主要介绍了如何利用Python写一个简单的在线编辑器,主要通过pywebio程序,实现了Python的简陋在线编辑器,需要的小伙伴可以参考一下,希望对你有所帮助
    2022-02-02
  • Python全面分析系统的时域特性和频率域特性

    Python全面分析系统的时域特性和频率域特性

    今天小编就为大家分享一篇Python全面分析系统的时域特性和频率域特性,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • python基于opencv批量生成验证码的示例

    python基于opencv批量生成验证码的示例

    这篇文章主要介绍了python基于opencv批量生成验证码的示例,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-04-04
  • 非递归的输出1-N的全排列实例(推荐)

    非递归的输出1-N的全排列实例(推荐)

    下面小编就为大家带来一篇非递归的输出1-N的全排列实例(推荐)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-04-04

最新评论