Pandas数据类型转换df.astype()及数据类型查看df.dtypes的使用
Pandas所支持的数据类型:
Python,numpy都有自己的一套数据格式,它们之间的对应关系可参考如下表格:
pandas默认的数据类型是int64,float64。
1.数据框字段类型查看:df.dtypes
数据框td_link_data如下
print(td_link_data)
链路ID 管理域 日期 时间 上行速率Mbps 上行对比速率Mbps 下行速率Mbps 下行对比速率Mbps 上行丢弃速率Mbps
0 500 10001 20210609 10 0.000 0.011 0.000 0.001 0.0
1 500 10001 20210609 11 0.000 0.007 0.000 0.000 0.0
2 500 10001 20210609 12 0.000 0.028 0.000 0.002 0.0
3 500 10001 20210609 13 0.000 0.056 0.000 0.003 0.0
4 500 10001 20210609 14 0.000 0.062 0.000 0.003 0.0
5 500 10001 20210609 15 0.000 0.074 0.000 0.005 0.0
6 500 10001 20210609 16 0.000 0.061 0.000 0.004 0.0
7 500 10001 20210609 17 0.000 0.069 0.000 0.004 0.0
8 500 10001 20210609 18 0.000 0.054 0.000 0.002 0.0
9 500 10001 20210609 19 0.000 0.054 0.000 0.002 0.0
10 500 10001 20210609 20 0.000 0.040 0.000 0.004 0.0
... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
... ... ... ... ... ... ... ... ... ...
239 500 10001 20210609 23 0.000 0.040 0.000 0.004 0.0
查看数据框td_link_data中数据类型df.dtypes:
print(td_link_data.dtypes)
结果:
链路ID int64
管理域 int64
日期 object
时间 object
上行速率Mbps float64
上行对比速率Mbps float64
下行速率Mbps float64
下行对比速率Mbps float64
上行丢弃速率Mbps float64
dtype: object
2.维度查看df.shape:
print(td_link_data.shape)
结果: 说明此数据框一共有240行,9列:
(240, 9)
3.数据框的策略基本信息df.info():
维度、列名称、数据格式、所占空间等
print(td_link_data.info())
结果:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 240 entries, 0 to 239
Data columns (total 9 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 链路ID 240 non-null int64
1 管理域 240 non-null int64
2 日期 240 non-null object
3 时间 240 non-null object
4 上行速率Mbps 240 non-null float64
5 上行对比速率Mbps 240 non-null float64
6 下行速率Mbps 240 non-null float64
7 下行对比速率Mbps 240 non-null float64
8 上行丢弃速率Mbps 240 non-null float64
dtypes: float64(5), int64(2), object(2)
memory usage: 17.0+ KB
解释:
1.数据类型:数据框 <class 'pandas.core.frame.DataFrame'>
2.表格的维度:240行x9列,RangeIndex:0-239
3.表格的列名,是否为空值和列字段类型dtype
4.数据框包含的字段类型及数量: float64(5), int64(2), object(2)
5.表格所占空间:17.0+ KB
4.某一列格式df['列名'].dtype:
print(td_link_data['管理域'].dtype)
结果:
int64
需要强调的是object类型实际上可以包括多种不同的类型,比如一列数据里,既有整型、浮点型,也有字符串类型,这些在pandas中都会被标识为‘object’,所以在处理数据时,可能需要额外的一些方法提前将这些字段做清洗,str.replace(),float(),int(),astype(),apply()等等。
5.数据类型转换.astype:
df.index.astype('int64') # 索引类型转换 df.astype('int64') # 所有数据转换为 int64 df.astype('int64', copy=False) # 不与原数据关联 td_link_data.astype({'管理域': 'int32'}) # 指定字段转指定类型 td_link_data['管理域'].astype('float') #某一列转换 td_link_data['链路ID'].astype('object') #某一列转换
参考链接:https://www.jianshu.com/p/8a5f0710cad3
到此这篇关于Pandas数据类型转换df.astype()及数据类型查看df.dtypes的使用的文章就介绍到这了,更多相关Pandas df.astype()及df.dtypes内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
这篇文章主要介绍了python3.5 + PyQt5 +Eric6 实现的一个计算器代码,在windows7 32位系统可以完美运行 计算器,有兴趣的可以了解一下。2017-03-03PyCharm+Pipenv虚拟环境开发和依赖管理的教程详解
这篇文章主要介绍了PyCharm+Pipenv虚拟环境作开发和依赖管理的教程,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下2020-04-04Python3使用requests模块实现显示下载进度的方法详解
这篇文章主要介绍了Python3使用requests模块实现显示下载进度的方法,结合实例形式分析了Python3中requests模块的配置、使用及显示进度条类的相关定义方法,需要的朋友可以参考下2019-02-02Python ConfigParser库轻松读写INI文件实例探究
这篇文章主要为大家介绍了Python ConfigParser库轻松读写INI文件实例探究,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2024-01-01
最新评论