利用Python读取Excel表内容的详细过程

更新时间：2022年10月17日 14:48:53 作者：WYKB_Mr_Q

python有多种方式可以去读取excel文档的内容,下面这篇文章主要给大家介绍了利用Python读取Excel表内容的详细过程,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

用python读取excel表中的数据

假如说有如下一张存储了数据的excel表，其中x1-x6是特征，y_label是特征对应的类别标签。我们想要使用python对以下数据进行数据分析，那么第一步就要先把excel表中的数据读取出来才行。这里我们主要使用到了python中的pandas库。

首先确定excel表存放的路径所在，比如我的路径是 ‘E:\relate_code\svm\dataset\data.xlsx’.

import pandas as pd

file_path = r'E:\relate_code\svm\dataset\data.xlsx'   # r对路径进行转义，windows需要
raw_data = pd.read_excel(file_path, header=0)  # header=0表示第一行是表头，就自动去除了
print(raw_data)

这样就可以取出数据了，输出见下图。可以看出，这里就没有表中的x1等表头信息了。

但是，最左边这里还有0-169这些行号额外信息，咱们可以用以下命令只要里面的有用信息，并保存到数组中。

data = raw_data.values     # 只提取表中信息
print(data)

输出结果：

这时候数据就都读进来了，并且存储为了数组形式。咱们可以选择想要的数据，比如想把x和y分开，毕竟一个是特征，另一个是标签，这时候可以使用以下代码。

features = data[:, 0:6]  # 由于是二维数组，所以第一个冒号表示选择所有行，之后0：6表示只要前六列的数据
labels = data[:, -1]     # 标签只要最后一列

1、还可以对特征进行选择，假如只要第四列的特征也可以使用：

feature_4 = data[: 3:4]  # 这样得出的数组依然是二维数组，便于后续特征操作

2、如果不想要第四个特征，其它都想要，也可以这样使用，需要用到numpy库：

import numpy as np

feature1_3 = data[:, 0:3]   # 取前三列特征
feature5_6 = data[:, 4:6]   # 取第5，第6列特征
feature_choose = np.hstack(feature1_3, feature5_6)   # 对两份特征进行特征拼接

这里再多说一下，np.hstack（）函数和 np.vstack（）函数：

这里是np.vstack()函数。主要是进行竖直堆叠，使用这个函数的时候要保证两个数组列数是一致的（都是三列），得出的结果如下。

import numpy as np

arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([7, 8, 9])
print(np.vstack((arr1, arr2)))

下面是np.hstack()函数，主要是进行水平堆叠，使用这个函数的时候要保证行数是一致的（都是两行）。

import numpy as np

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[7, 8, 9], [10, 11, 12]])
print(np.hstack((arr1, arr2)))

就先介绍到这里吧，下一篇文章介绍机器学习的代码使用！

总结

到此这篇关于利用Python读取Excel表内容的文章就介绍到这了,更多相关Python读取Excel表内容内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Python实现解压当天创建的ZIP文件到指定文件夹中
这篇文章主要为大家详细介绍了Python如何实现解压当天创建的ZIP文件到指定文件夹中,文中的示例代码讲解详细,需要的小伙伴可以参考下
2024-03-03
python中文分词库jieba使用方法详解
这篇文章主要介绍了python中文分词库jieba使用方法详解,需要的朋友可以参考下
2020-02-02
python用ConfigObj读写配置文件的实现代码
发现一个简单而又强大的读写配置文件的lib，个人觉得最大的亮点在于自带的格式校验功能，并且支持复杂的嵌套格式，而且使用起来也相当的简便
2013-03-03
pandas series序列转化为星期几的实例
下面小编就为大家分享一篇pandas series序列转化为星期几的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-04-04
Python中的变量和作用域详解
这篇文章主要介绍了Python中的变量和作用域详解的相关资料,非常不错，具有参考借鉴价值，需要的朋友可以参考下
2016-07-07
Python中logger模块的使用场景分析
logger是python的内置模块，用以输出代码运行过程中的运行情况，极大的方便了我们的debug过程，本文通过实例代码给大家介绍了Python中logger模块的使用教程,需要的朋友可以参考下
2023-06-06
浅析Python中的弱引用与基础类型支持情况
最近有一个业务场景需要用Python自行实现一个简单的LRU cache，不可避免的接触到了弱引用这一概念，所以下面就来和大家分享一下相关的知识吧
2023-07-07
Django实现文章详情页面跳转代码实例
这篇文章主要介绍了Django实现文章详情页面跳转代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-09-09
解决win7操作系统Python3.7.1安装后启动提示缺少.dll文件问题
这篇文章主要介绍了解决win7操作系统Python3.7.1安装后启动提示缺少.dll文件问题,本文给大家提供两种解决方法，非常不错，具有一定的参考借鉴价值，需要的朋友可以参考下
2019-07-07
python webp图片格式转化的方法
这篇文章主要为大家详细介绍了python webp图片格式转化的方法，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2021-04-04