Numpy 多维数据数组的实现

更新时间：2020年06月18日 10:37:11 作者：数据地狱官

这篇文章主要介绍了Numpy 多维数据数组的实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

numpy包(模块)几乎总是用于Python中的数值计算。这个软件包为Python提供了高性能的向量、矩阵、张量数据类型。它是在C和Fortran中创建的，因此当计算被矢量化（用矩阵和矢量表示操作）时，性能很高。

1.模块的导入：

%matplotlib inline
import matplotlib.pyplot as plt
from numpy import *

2.数组创建numpy

有几种初始化numpy数组的方法，例如：使用Python的list或tuple。使用旨在创建Numpy数组的函数，如arrange、linspace等。从文件中读取数据(例如Python pickle格式)

2.1根据列表创建numpy.array

v = array([1,2,3,4])
v

M = array([[1, 2], [3, 4]])
M

v和M 都是ndarray类型的对象，由numpy模块创建。

type(v), type(M)

v数组和M数组的区别在于它们的尺寸（形式）。我们可以使用ndarray.shape属性来获取大小信息。

v.shape

M.shape

矩阵中元素的数量可以通过属性ndarray.size

M.size

也可以使用numpy方法numpy.shape 和 numpy.size

shape(M)

size(M)

numpy.ndarray 看起来像一个普通的 Python 列表。使用它们而不是Python列表有几个原因。

Python的列表是非常常见的。它们可以包含任何对象。他们是动态类型化的。它们不支持矩阵和诗词作品等数学运算。由于动态类型的原因，在Python中用list实现这种操作并不是很有效。
Numpy数组是静态类型化和同质化的。元素类型是在创建数组时定义的（那么数组数据类型可以改变）。
Numpy数组不是很耗费内存。
得益于静态类型化，数学函数如乘积和numpy数组的和可以在编译语言中实现（使用C和Fortran）。
使用ndarray数组的dtype（数据类型）属性，我们可以看到数组的数据类型。

M.dtype

试图分配一个错误类型(不一样的类型)的值会导致错误。

M[0,0] = "hello"

创建数组时，可以分别指定数据类型。

M = array([[1, 2], [3, 4]], dtype=complex)
M

通常使用以下dtype值：int、float、complex、bool、object等。

我们也可以用比特来指定大小：int64、int16、float128、complex128。

3.使用函数生成数组

使用python列表来指定大型数组是不切实际的。你可以使用各种Numpy方法。

3.1arrange

x = arange(0, 10, 1) # arguments: start, stop, step
x

x = arange(-1, 1, 0.1)
x

3.2linspace 和 logspace

使用linspace，区间的两端都被包括在内，参数:（开始，停止，点的数量)

linspace(0, 10, 25)

logspace(0, 10, 10, base=e)

3.3mgrid

x, y = mgrid[0:5, 0:5]
x
y

3.4随机数

#导入所需模块
from numpy import random

#区间[0,1]内的均匀分布数。
random.rand(5,5)

#来自于正态分布的随机数
random.randn(5,5)

3.6diag

#对角矩阵
diag([1,2,3])

#偏移对角矩阵
diag([1,2,3], k=1)

3.5零和单位矩阵

zeros((3,3))

ones((3,3))

4.文件导入和导出

4.1逗号分隔的值(CSV)

一个非常常见的数据存储格式是CSV，以及类似的格式，如TSV（制表分隔值）。要从这些文件中读取数据，你可以使用以下方法numpy.genfromtxt

data = genfromtxt('stockholm_td_adj.dat')
data.shape

fig, ax = plt.subplots(figsize=(14,4))
ax.plot(data[:,0]+data[:,1]/12.0+data[:,2]/365, data[:,5])
ax.axis('tight')
ax.set_title('Температура в Стокгольме')
ax.set_xlabel('год')
ax.set_ylabel('температура (C)');

使用numpy.savetxt我们可以将数组保存在CSV中。

M = random.rand(3,3)
M

savetxt("random-matrix.csv", M)
savetxt("random-matrix.csv", M, fmt='%.5f') # fmt 指定格式

4.2numpy数组的主要文件格式。

保存和读取的方法numpy.save 和 numpy.load

save("random-matrix.npy", M)
load("random-matrix.npy")

4.3numpy数组的其他属性

M.itemsize#每个byte中的单元数
M.nbytes#byte数目
M.ndim#单位数，计数

5.使用数组

5.1编制索引

你可以使用方括号和索引来选择数组的元素。

# v是一个只有一个维度的向量，所以一个索引就足以获得元素。
v[0]

# M是一个矩阵(二维数组)，所以需要两个索引(行，列)。
M[1,1]

如果我们省略了多维数组中的索引，就会返回一些值（一般情况下，N-1维的数组）。

M[1]

M[1,:]#第一行

M[:,1]#第一列

使用索引，你可以为单个数组元素赋值。

M[0,0] = 1
M

也适用于行和列

#也适用于行和列
M[1,:] = 0
M[:,2] = -1
M

5.2选择数组的一部分

你可以使用M[lower:uperior:step]语法来获取一个数组的一部分。

A = array([1,2,3,4,5])
A

A[1:3]

数组的部分是可变的：如果给它们分配新的值，那么从它们提取的数组就会改变原来的数组。

A[1:3] = [-2,-3]
A

我们可以省略M[lower:upper:step]中的部分参数。

A[::]#下限、上限、默认步数

低于零的指数从数组的末端开始计算。

A = array([1,2,3,4,5])
A[-1]#最后一个元素
A[-3:]#最后三个元素

索引分区也适用于多维数组。

A = array([[n+m*10 for n in range(5)] for m in range(5)]) 
A

#方阵
A[1:4, 1:4]

#渐进，带有指定间隔数
A[::2, ::2]

5.3先进的索引方法

数组的值可以作为选择项目的索引。

row_indices = [1, 2, 3]
A[row_indices]

col_indices = [1, 2, -1]
A[row_indices, col_indices]

你也可以使用掩码：如果掩码类型为bool，那么根据掩码元素的值与相应的索引，选择该元素（True）或不选择（False）。

B = array([n for n in range(5)])
B

row_mask = array([True, False, True, False, False])
B[row_mask]

row_mask = array([1,0,1,0,0], dtype=bool)
B[row_mask]

这个函数对于根据某些条件从数组中选择元素非常有用。

x = arange(0, 10, 0.5)
x

mask = (5 < x) * (x < 7.5)
mask

x[mask]

5.4从数组中提取数据和创建数组的函数。

5.4.1where

索引掩码可以通过使用以下方法转换为位置索引 where

indices = where(mask)
indices

x[indices]#这个索引相当于x[mask]的索引。

5.4.2diag

使用diag函数还可以提取对角线和子对角线元素。

diag(A)

diag(A,-1)

5.4.3take

类似于上述的索引方法。

v2 = arange(-3,3)
v2

row_indices = [1, 3, 5]
v2[row_indices]

v2.take(row_indices)

但take也可以在列表和其他对象上工作。

take([-3, -2, -1, 0, 1, 2], row_indices)

5.4.4choose

从多个数组中提取数值。

which = [1, 0, 1, 0]
choices = [[-2,-2,-2,-2], [5,5,5,5]]
 
choose(which, choices) # 0th elem of 0 array, 1st elem of 1 array, ...

6.线性代数

6.1点积运算

v1 = arange(0, 5)
v1 * 2

v1 + 2

A * 2

A + 2

6.2基础运算

A * A

v1 * v1

A.shape, v1.shape

A * v1

7.矩阵

7.1矩阵

dot(A, A)

dot(A, v1)

dot(v1, v1)

也可以将数组转换为矩阵的类型。然后再根据矩阵代数的规律进行+、-、*的算术运算。

M = matrix(A)
v = matrix(v1).T#换位
v

M * M

M * v

v.T * v

v + M*v

8.数据处理

shape(data)

8.1平均值

#温度柱
mean(data[:,3])

过去200年，斯德哥尔摩的平均气温在6.2摄氏度左右。

8.2标准差和离散度

std(data[:,3]), var(data[:,3])

8.3sum, prod, и trace

d = arange(0, 10)
d

#求和
sum(d)

#所有元素的乘积
prod(d+1)
#累计总和
cumsum(d)

#累积乘积
cumprod(d+1)
#和diag(A).sum()一样
trace(A)

8.4多变量数据

m = random.rand(3,3)
m

m.max()

#每列最大值 
m.max(axis=0)

#每行最大值 
m.max(axis=1)

9.改变阵列的形状和大小

n, m = A.shape
B = A.reshape((1,n*m))
B

B[0,0:5] = 5
B

B = A.flatten()
B

B[0:5] = 10
B

#A没有改变，因为B是A的副本，不是同一个对象的引用。
A

10.增加一个新的度量newaxis

v = array([1,2,3])
shape(v)

#向量 -> 单列矩阵
v[:, newaxis]

#尺寸
v[:,newaxis].shape

v[newaxis,:].shape

11.联合

b = array([[5, 6]])
a = array([[5, 6]])
concatenate((a, b), axis=0)

concatenate((a, b), axis=1)

12.hstack and vstack

vstack((a,b))

hstack((a,b))

13.Copy и "deep copy"

A = array([[1, 2], [3, 4]])
A

#B等同于A
B = A 
#改变B，将影响A
B[0,0] = 10
 
B

B = copy(A)
#现在改变B将不再影响A
B[0,0] = -5
B

14.矩阵的循环

v = array([1,2,3,4])
 
for element in v:
  print(element)

M = array([[1,2], [3,4]])
 
for row in M:
  print("row", row)
  
  for element in row:
    print(element)

通过枚举，可以同时获得元素的值和索引。

for row_idx, row in enumerate(M):
  print("row_idx", row_idx, "row", row)
  
  for col_idx, element in enumerate(row):
    print("col_idx", col_idx, "element", element)
    
    # update the matrix M: square each element
    M[row_idx, col_idx] = element ** 2

#每个元素现在都是列表
M

到此这篇关于Numpy 多维数据数组的实现的文章就介绍到这了,更多相关Numpy 多维数据数组内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

如何在 Django 模板中输出 "{{"
这篇文章主要介绍了如何在 Django 模板中输出 "{{" ,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧
2020-01-01
Python实现拷贝/删除文件夹的方法详解
这篇文章主要介绍了Python实现拷贝/删除文件夹的方法,涉及Python针对文件夹的递归、遍历、拷贝、删除等相关操作技巧与注意事项,需要的朋友可以参考下
2018-08-08
python中的GUI实现计算器
这篇文章主要介绍了如何利用python中的GUI实现计算器，文章教大家用用python的GUI做界面布局，计算器代码熟悉控件的使用方法、优化计算器代码，解决获取按钮文本的方法，具有一定的参考价值,需要的朋友可以参考一下
2021-12-12
解决Python获取文件提示找不到指定路径can‘t open file 'area.py':
这篇文章主要给大家介绍了关于如何解决Python获取文件提示找不到指定路径can‘t open file 'area.py':[Errno 2] No such file or directory的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下
2023-11-11
python 请求服务器的实现代码(http请求和https请求)
本篇文章主要介绍了python 请求服务器的实现代码(http请求和https请求)，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧
2018-05-05
python实现打砖块游戏
这篇文章主要为大家详细介绍了Python实现打砖块游戏，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-02-02
Pytorch使用卷积神经网络对CIFAR10图片进行分类方式
这篇文章主要介绍了Pytorch使用卷积神经网络对CIFAR10图片进行分类方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
2024-02-02
Python图像处理之模糊图像判断
这篇文章主要为大家详细介绍了Python图像处理中的模糊图像判断的实现，文中的示例代码讲解详细，具有一定的借鉴价值，需要的可以参考一下
2022-12-12
使用keras和tensorflow保存为可部署的pb格式
这篇文章主要介绍了使用keras和tensorflow保存为可部署的pb格式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-05-05
Matplotlib绘图基础之动画绘制详解
matplotlib的动画一直是一个强大但使用频率不高的功能，通过动画来展示数据和模型的变化过程，可使数据的可视化更加生动形象,下面就跟随小编一起学习一下Matplotlib是如何绘制动画的吧
2023-08-08

Numpy 多维数据数组的实现

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具