pandas基础 Series与Dataframe与numpy对二进制文件输入输出
Series
series是一种一维的数组型对象,它包含了一个值序列和一个数据标签
import pandas as pd import numpy as np
创建第一个series:
s1=pd.Series([4,7,-5,3])#创建一个series,索引为默认值 print(s1)
通过简单的一个传入数组,就可以形成一个一维的数据表格
获取序列的值和标签序列,应该如何去做?
我们在想这样一个问题,这个序列标签是默认的0....,如果我们需要自己去定义那应该怎么办?
然后我们就可以通过索引去获取相应的值了
series可以看做一个定长的字典,有序的字典,这个和Python内部的不一样,因为它是无序的
有时候我们已经有了一个字典,但是里面元素过于多,我只想要我要的数据,这个时候可以使用这个属性:pd.Series(data,index=indexs),datahi一个字典类型的数据集,indexs是我们需要的数据的键,我们可以把它组成一个列表然后,既可以提取又可以展示
如何自己确定行和列的标签:
通过这个描述性的操作,我们可以对数据有一个大体的概念认识
排序操作:
上述的数据是随机生成的,对于基本的索引和切片与Python其实差不多的,我们需要掌握的是基础的语法和知识点,方便我们在后续操作的过程之中可以快速的查阅知识点
Python numpy对二进制文件输入输出
numpy可以在硬盘中将数据以文本或二进制文件的形式进行存入硬盘或由硬盘载入。在本篇文章里面我们需要简单的讨论内建二进制格式,而对于其他表格pandas才是“天选之子”
np.save和np.load是高效存取硬盘数据的两大工具函数。数组在默认情况下是以压缩的格式进行储存的,后缀名是.npy
上面就介绍了数据的存储和数据的加载方法,np.savez:用于未压缩文件中保存多个数据
到此这篇关于pandas基础 Series与Dataframe与numpy对二进制文件输入输出的文章就介绍到这了,更多相关pandas Series内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
最新评论