Pandas的Series结构及常用操作实例
pandas的核心
pandas 和核心是 Series 和 Dataframe 两大数据结构,数据分析的所有事务都是围绕这两种结构进行的。Series 数据结构是用于储存一个序列的一维数组,DataFrame 数据结构是用于存储复杂数据的二维数据结构。
结构
Series 类似于一维数组。内部是由两个相互关联的数组组成的,一个数组存放数据(值value),一个数组(index)存放索引。结构如下:
index | values |
0 | 1600 |
1 | 12 |
2 | 1 |
常用操作
创建 Series 对象
pandas.Series(data[,index])
data 是输入给Series构造器的数据,可以是 NumPy 中任何类型的数据。
index 是索引,如果不输入的话默认是从 0 开始。
也可以将字典类型的数据转换为 Series
查看标签
Series 的属性 values 和 index 可以查看值和标签
选择内部元素
选择内部元素其实和NumPy差不多,直接指定索引就可以了,也可以使用切片来选择内部元素,还可以选择标签,不过需要把标签用数组括起来。
给元素赋值
赋值和 NumPy 也是一模一样的.
Series 对象的简单运算
因为 pandas 开发是以 NumPy 库为基础的,所以 NumPy 数组中许多操作都会保留到 Series 对象中,可以进行(+,-,*,/ )和其他数学函数运算等。 Series 还可以筛选元素,如:
Series 对象之间的简单运算
Series 可以通过标签识别对齐不一 的函数,就是 Series 运算时的补齐功能。
统计 Series 对象的组成元素
可以通过 unique() 函数去重
value_counts() 函数 不仅可以返回不同元素,还可以返回个数,下图中,左边是元素,右边是元素出现的次数。
isin() 函数 还可以判断元素是否存在,存在返回 True ,不存在返回False
到此这篇关于Pandas的Series结构及常用操作实例的文章就介绍到这了,更多相关Pandas的Series结构说明内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
最新评论