NumPy 与 Python 内置列表计算标准差区别详析

 更新时间:2022年07月12日 16:17:19   作者:宇宙之一粟  
这篇文章主要介绍了NumPy与Python内置列表计算标准差区别详析,NumPy,是Numerical Python的简称,用于高性能科学计算和数据分析的基础包,更多相关内容需要的朋友可以参考一下

1 什么是 Numpy

NumPy,是 Numerical Python 的简称,用于高性能科学计算和数据分析的基础包,像数学科学工具(pandas)和框架(Scikit-learn)中都使用到了 NumPy 这个包。

NumPy 中的基本数据结构是ndarray或者 N 维数值数组,在形式上来说,它的结构有点像 Python 的基础类型——Python列表。

但本质上,这两者并不同,可以看到一个简单的对比。

我们创建两个列表,当我们创建好了之后,可以使用 +运算符进行连接:

list1 = [i for i in range(1,11)]
list2 = [i**2 for i in range(1,11)]
print(list1+list2)
# [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

列表中元素的处理感觉像对象,不是很数字,不是吗? 如果这些是数字向量而不是简单的数字列表,您会期望 + 运算符的行为略有不同,并将第一个列表中的数字按元素添加到第二个列表中的相应数字中。

接下来看一下 Nympy 的数组版本:

import numpy as np
arr1 = np.array(list1)
arr2 = np.array(list2)
arr1 + arr2
# array([ 2, 6, 12, 20, 30, 42, 56, 72, 90, 110])

通过 numpy 的np.array数组方法实现了两个列表内的逐个值进行相加。

我们通过dir 函数来看两者的区别,先看 Python 内置列表 list1的内置方法:

再用同样的方法看一下 arr1中的方法:

NumPy 数组对象还有更多可用的函数和属性。 特别要注意诸如meanstdsum之类的方法,因为它们清楚地表明重点关注使用这种数组对象的数值/统计计算。 而且这些操作也很快。

2 NumPy 数组和 Python 内置计算对比

NumPy 的速度要快得多,因为它的矢量化实现以及它的许多核心例程最初是用 C 语言(基于 CPython 框架)编写的。 NumPy 数组是同构类型的密集排列的数组。 相比之下,Python 列表是指向对象的指针数组,即使它们都属于同一类型。 因此,我们得到了参考局部性的好处。

许多 NumPy 操作是用 C 语言实现的,避免了 Python 中的循环、指针间接和逐元素动态类型检查的一般成本。 特别是,速度的提升取决于您正在执行的操作。 对于数据科学和 ML 任务,这是一个无价的优势,因为它避免了长和多维数组中的循环。

让我们使用 @timing计时装饰器来说明这一点。 这是一个围绕两个函数 std_devstd_dev_python包装装饰器的代码,分别使用 NumPy 和本机 Python 代码实现列表/数组的标准差计算。

3 函数计算时间装饰器

我们可以使用 Python 装饰器和functools模块的wrapping来写一个 时间装饰器timing:

def timing(func):
@wraps(func)
def wrap(*args, **kw):
begin_time = time()
result = func(*args, **kw)
end_time = time()
print(f"Function '{func.__name__}' took {end_time-begin_time} seconds to run")
return result
return wrap

4 标准差计算公式

然后利用这个时间装饰器来看 Numpy 数组和 Python 内置的列表,然后计算他们的标准差,

公式如图:

  • 定义 Numpy 计算标准差的函数std_dev()numpy 模块中内置了标准差公式的函数 a.std(),我们可以直接调用
  • 列表计算公式方法需要按照公式一步一步计算:
  • 先求求出宗和s
  • 然后求出平均值average
  • 计算每个数值与平均值的差的平方,再求和sumsq
  • 再求出sumsq 的平均值 sumsq_average
  • 得到最终的标准差结果result

代码如下:

from functools import wraps
from time import time
import numpy as np
from math import sqrt
def timing(func):
@wraps(func)
def wrap(*args, **kw):
begin_time = time()
result = func(*args, **kw)
end_time = time()
# print(f"Function '{func.__name__}' with arguments {args},keywords {kw} took {end_time-begin_time} seconds to run")
print(f"Function '{func.__name__}' took {end_time-begin_time} seconds to run")
return result
return wrap

@timing
def std_dev(a):
if isinstance(a, list):
a = np.array(a)
s = a.std()
return s

@timing
def std_dev_python(lst):

length = len(lst)
s = sum(lst)
average = s / length
sumsq = 0
for i in lst:
sumsq += (i-average)**2
sumsq_average = sumsq/length
result = sqrt(sumsq_average)
return result

运行结果,最终可以看到 1000000 个值得标准差的值为 288675.13459,而 Numpy 计算时间为 0.0080 s,而 Python 原生计算方式为 0.2499 s

由此可见,Numpy 的方式明显更快。

5 总结

NumPy 是专门针对数组的操作和运算进行了设计,所以数组的存储效率和输入输出性能远优于Python中的嵌套列表,数组越大,NumPy的优势就越明显。

到此这篇关于NumPy 与 Python 内置列表计算标准差区别详析的文章就介绍到这了,更多相关Python 内置列表内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 快速了解Python相对导入

    快速了解Python相对导入

    这篇文章主要介绍了快速了解Python相对导入,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Python利用Django如何写restful api接口详解

    Python利用Django如何写restful api接口详解

    这篇文章主要给大家介绍了关于Python利用Django如何写restful api接口的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-06-06
  • 最新tensorflow与pytorch环境搭建的实现步骤

    最新tensorflow与pytorch环境搭建的实现步骤

    深度学习相关的热门框架主要为Tensorflow和Pytorch,本文主要介绍了搭建最新tensorflow与pytorch环境,具有一定的参考价值,感兴趣的可以了解一下
    2024-04-04
  • 理解Python数据离散化手写if-elif语句与pandas中cut()方法实现

    理解Python数据离散化手写if-elif语句与pandas中cut()方法实现

    这篇文章主要介绍了通过手写if-elif语句与pandas中cut()方法实现示例理解Python数据离散化详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-05-05
  • Python实现ElGamal加密算法的示例代码

    Python实现ElGamal加密算法的示例代码

    ElGamal加密算法是一个基于迪菲-赫尔曼密钥交换的非对称加密算法。这篇文章通过示例代码给大家介绍Python实现ElGamal加密算法的相关知识,感兴趣的朋友一起看看吧
    2020-06-06
  • 解析python调用函数加括号和不加括号的区别

    解析python调用函数加括号和不加括号的区别

    这篇文章主要介绍了python调用函数加括号和不加括号的区别,不带括号时,调用的是这个函数本身 ,是整个函数体,是一个函数对象,不须等该函数执行完成,具体实例代码跟随小编一起看看吧
    2021-10-10
  • python中列表推导式与生成器表达式对比详解

    python中列表推导式与生成器表达式对比详解

    python当然不是一门编译型语言,但是它还是要被解析成二进制的字节码才能被执行,执行它的正是python解释器,下面这篇文章主要给大家介绍了关于python中列表推导式与生成器表达式对比的相关资料,需要的朋友可以参考下
    2023-01-01
  • python实现定制交互式命令行的方法

    python实现定制交互式命令行的方法

    这篇文章主要介绍了python实现定制交互式命令行的方法,需要的朋友可以参考下
    2014-07-07
  • Python实现检测SSL证书是否过期

    Python实现检测SSL证书是否过期

    我们知道 SSL 证书是会过期的,一旦过期之后需要重新申请,如果没有及时更换证书的话,就有可能导致网站出问题,所以本文介绍了如何利用Python实现检测SSL证书是否过期,需要的可以参考下
    2023-08-08
  • Python身份验证第三方库(7个)

    Python身份验证第三方库(7个)

    身份验证在很多项目上都可以用到,本文主要介绍了Python身份验证第三方库(7个),具有一定的参考价值,感兴趣的可以了解一下
    2023-12-12

最新评论