numpy中数组的堆叠方法

 更新时间:2023年02月14日 09:28:56   作者:夏日轻风有你  
本文主要介绍了numpy中数组的堆叠方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

一、环境 

Anaconda 3
Python 3.6
Numpy 1.14.3

二、功能用途及官方说明

1、hstack功能:沿水平方向堆叠数组(numpy array)
用途举例:机器学习数据集准备过程中,可以用于将数据列与标签列在水平方向上合并,从而得到带标签的数据集
官方说明https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.hstack.html#numpy.hstack

2、vstack功能:沿垂直方向堆叠数组(numpy array)
用途举例:机器学习数据集准备过程中,可以用于将从过个数据文件中加载的数据行在垂直方向上合并,从而将所有数据集整合为一个数据集
官方说明https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.vstack.html

三、实例

实例一:使用 np.hstack 将数据与标签合并

>>> import numpy as np
# 数据准备
>>> data = [i for i in range(18)]
>>> data_array = np.asarray(data)
>>> data_array = np.asarray(data).reshape([6,3])
>>> data_array.shape
(6, 3)
>>> data_array
array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14],
       [15, 16, 17]])
# 标签准备
>>> label = [0, 1] *3 
>>> label_array = np.asarray(label)
>>> label_array.shape
(6,)
>>> label_array
array([0, 1, 0, 1, 0, 1])
# 在数据的右侧水平方向上合并标签
>>> data_label = np.hstack((data_array,label_array))
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/lib/python3.6/dist-packages/numpy/core/shape_base.py", line 288, in hstack
    return _nx.concatenate(arrs, 1)
ValueError: all the input arrays must have same number of dimensions

直观上看, np.hstack 只要保证要合并的两个 numpy 数组的数据行相同,那么两个 numpy 数组的列就可以沿着水平方向合并了!这里也是初学者常遇到个一个问题,仔细看一下报错信息就会很容易发现,问题出在要合并的两个 numpy 数组的维度数量不一致,data_array 的维度是二维(6, 3),而 label_array 的维度是一维 (6, ),因此即使两个 numpy 数组的行数一样,也不能沿水平方向进行正常的列堆叠!
正确的方法:

# 在准备标签时,先将一维的标签 reshape 为二维 numpy 数组,即 6 行 1 列
>>> label_array = label_array.reshape(-1,1)
>>> data_label = np.hstack((data_array,label_array))
>>> data_label.shape
(6, 4)
>>> data_label
array([[ 0,  1,  2,  0],
       [ 3,  4,  5,  1],
       [ 6,  7,  8,  0],
       [ 9, 10, 11,  1],
       [12, 13, 14,  0],
       [15, 16, 17,  1]])

实例二:使用 np.vstack 合并两组数据集

# 准备第一数据集
>>> import numpy as np
>>> data1 = np.random.normal(0,1,(2,5))
>>> data1.shape
(2, 5)
>>> data1
array([[-1.49100993,  0.03782522,  0.33961941, -0.64073217,  0.84000297],
       [-1.02662855, -0.91858614, -0.27410549, -0.86956142, -0.44147313]])
# 准备第二个数据集
>>> data2 = np.arange(0,30,2)
>>> data2 = np.arange(0,30,2).reshape([3,5])
>>> data2.shape
(3, 5)
>>> data2
array([[ 0,  2,  4,  6,  8],
       [10, 12, 14, 16, 18],
       [20, 22, 24, 26, 28]])
# 垂直方向堆叠连个数据集
>>> data = np.vstack((data1,data2))
>>> data.shape
(5, 5)
>>> data
array([[-1.49100993,  0.03782522,  0.33961941, -0.64073217,  0.84000297],
       [-1.02662855, -0.91858614, -0.27410549, -0.86956142, -0.44147313],
       [ 0.        ,  2.        ,  4.        ,  6.        ,  8.        ],
       [10.        , 12.        , 14.        , 16.        , 18.        ],
       [20.        , 22.        , 24.        , 26.        , 28.        ]])

实例三:借助列表(list)对多个数据集进行一次性堆叠合并
可以用于在 for / while 循环读取数据集时,依次先将数据加入到列表(list)中,然后在多个数据集一起堆叠合并,而不用在繁琐地使用两两数据集堆叠合并的方式了

# 准备第一个数据集
>>> data_v1 = np.random.randint(0,10,(2,5))
>>> data_v1.shape
(2, 5)
>>> data_v1
array([[4, 4, 0, 7, 3],
       [3, 9, 0, 3, 0]])
# 准备第二个数据集
>>> data_v2 = np.ones((3,5))
>>> data_v2.shape
(3, 5)
>>> data_v2
array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])
# 准备第三个数据集
>>> data_v3 = np.full((2,5),0)
>>> data_v3.shape
(2, 5)
>>> data_v3
array([[0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0]])
# 定义一个临时存放多个数据集的列表(list),并将所有数据集添加到列表中
>>> data_vlist = []
>>> data_vlist.append(data_v1)
>>> data_vlist.append(data_v2)
>>> data_vlist.append(data_v3)
>>> len(data_vlist)
3
>>> data_vlist
[array([[4, 4, 0, 7, 3],
       [3, 9, 0, 3, 0]]), array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]]), array([[0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0]])]
# 将存放所有数据集的列表作为 np.vstack() 的输入参数,即可一次性合并多个数据集
>>> data_vstack = np.vstack(data_vlist)
>>> data_vstack
array([[4., 4., 0., 7., 3.],
       [3., 9., 0., 3., 0.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])
>>> data_vstack.shape
(7, 5)
>>> data_vstack
array([[4., 4., 0., 7., 3.],
       [3., 9., 0., 3., 0.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])
#########################################################

同理,np.hstack 也可以借助列表(list)一次性水平合并多个数据列

# 准备首个数列
>>> import numpy as np
>>> data_h1 = np.random.randint(0, 10, (3,3))
>>> data_h1.shape
(3, 3)
>>> data_h1 
array([[6, 4, 5],
       [4, 5, 0],
       [7, 1, 9]])
# 准备第二个数列
>>> data_h2 = np.zeros((3,2))
>>> data_h2.shape
(3, 2)
>>> data_h2
array([[0., 0.],
       [0., 0.],
       [0., 0.]])
# 准备第三个数列
>>> data_h3 = np.ones((3,1), dtype=int)
>>> data_h3.shape
(3, 1)
>>> data_h3
array([[1],
       [1],
       [1]])
# 定义一个临时存放多个数据列的列表(list),并将所有数据列添加到列表中
>>> data_hlist = []
>>> data_hlist.append(data_h1)
>>> data_hlist.append(data_h2)
>>> data_hlist.append(data_h3)
>>> len(data_hlist)
3
>>> data_hlist
[array([[6, 4, 5],
       [4, 5, 0],
       [7, 1, 9]]), array([[0., 0.],
       [0., 0.],
       [0., 0.]]), array([[1],
       [1],
       [1]])]
# 将存放所有数据列的列表作为 np.hstack() 的输入参数,即可一次性合并多个数据列
>>> data_hstack = np.hstack(data_hlist)
>>> data_hstack.shape
(3, 6)
>>> data_hstack
array([[6., 4., 5., 0., 0., 1.],
       [4., 5., 0., 0., 0., 1.],
       [7., 1., 9., 0., 0., 1.]])

到此这篇关于numpy中数组的堆叠方法的文章就介绍到这了,更多相关numpy 数组堆叠内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:

相关文章

  • python实现时间o(1)的最小栈的实例代码

    python实现时间o(1)的最小栈的实例代码

    这篇文章主要介绍了python实现时间o(1)的最小栈的实例代码,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-07-07
  • Python存储或读取json时如何引入额外的双引号和转义引号

    Python存储或读取json时如何引入额外的双引号和转义引号

    这篇文章主要介绍了Python存储或读取json时如何引入额外的双引号和转义引号问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • Python中空格的转义字符方式

    Python中空格的转义字符方式

    这篇文章主要介绍了Python中空格的转义字符方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-03-03
  • python实现字符串完美拆分split()的方法

    python实现字符串完美拆分split()的方法

    今天小编就为大家分享一篇python实现字符串完美拆分split()的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Sanic框架路由用法实例分析

    Sanic框架路由用法实例分析

    这篇文章主要介绍了Sanic框架路由用法,结合实例形式较为详细的分析了Sanic框架路由的原理、请求参数、请求类型、重定向等相关操作技巧,需要的朋友可以参考下
    2018-07-07
  • Python输出列表(List)不带中括号和引号的问题及解决方法

    Python输出列表(List)不带中括号和引号的问题及解决方法

    这篇文章主要介绍了Python输出列表(List)不带中括号和引号的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-02-02
  • python如何查看网页代码

    python如何查看网页代码

    在本篇文章里小编给大家整理了关于python查看网页代码方法,需要的朋友们可以参考学习下。
    2020-06-06
  • python 字符串索引取值的实现示例

    python 字符串索引取值的实现示例

    本文主要介绍了python 字符串索引取值的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-07-07
  • python 通过exifread读取照片信息

    python 通过exifread读取照片信息

    这篇文章主要介绍了python 如何通过exifread读取照片信息,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2020-12-12
  • python2.7 安装pip的方法步骤(管用)

    python2.7 安装pip的方法步骤(管用)

    这篇文章主要介绍了python2.7 安装pip的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05

最新评论