Python使用Pandas对csv文件进行数据处理的方法

 更新时间:2019年08月01日 11:11:00   作者:香香爹  
这篇文章主要介绍了Python使用Pandas对csv文件进行数据处理的方法,本文通过实例代码相结合给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下

今天接到一个新的任务,要对一个140多M的csv文件进行数据处理,总共有170多万行,尝试了导入本地的MySQL数据库进行查询,结果用Navicat导入直接卡死....估计是XAMPP套装里面全默认配置的MySQL性能不给力,又尝试用R搞一下吧结果发现光加载csv文件就要3分钟左右的时间,相当不给力啊,翻了翻万能的知乎发现了Python下的一个神器包:Pandas(熊猫们?),加载这个140多M的csv文件两秒钟就搞定,后面的分类汇总等操作也都是秒开,太牛逼了!记录一下这次数据处理的过程:

使用Python3.6.4环境(对中文支持比较好),安装Pandas包

pip install pandas

基本使用:

import pandas as pd
import numpy as np #进行具体的sum,count等计算时候要用到的
df=pd.read_csv('d:/snp/nh23.csv') #这里绝对路径一定要用/,windows下也是如此,不加参数默认csv文件首行为标题行
df.head() #查看引入的csv文件前5行数据
df[“播种面积”] #查看指定列,后面跟[:5]查看前5行数据

df[“调查对象代码”].str[:6] #获取指定列前6位字符串

df["ADDR"]=df["调查对象代码"].str[:6] #将上一行处理后的6位地址码作为新列ADDR插入

gp=df.groupby(["ADDR","代码"])["播种面积"].sum() #根据ADDR和代码进行分组后对播种面积列进行sum求和计算

pv=df.pivot_table(["播种面积"],index="ADDR",columns="代码",margins=True,aggfunc=np.sum,fill_value=0) #数据透视图,对播种面积列进行汇总计算,index为行,columns为列,margins=True增加一个全部行汇总,aggfunc=np.sum透视图中对播种面积值进行sum计算,这里np是开头import的numpy as np,fill_value=0对空值进行0替换,否则没有数据会显示NaN

pv.to_csv("d:/snp/test.csv") #写入csv文件

总结

以上所述是小编给大家介绍的Python使用Pandas对csv文件进行数据处理的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

  • Python中@符号的用法小结

    Python中@符号的用法小结

    @符号在Python中最常见的使用情况是在装饰器中,本文主要介绍了Python中@符号的用法小结,具有一定的参考价值,感兴趣的可以了解一下
    2023-09-09
  • python中list*n生成多维数组与for循环生成多维数组的区别说明

    python中list*n生成多维数组与for循环生成多维数组的区别说明

    这篇文章主要介绍了python中list*n生成多维数组与for循环生成多维数组的区别说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • python的Template使用指南

    python的Template使用指南

    本文主要讲解了python中Template使用方法以及使用技巧,非常实用,有需要的朋友可以参考下
    2014-09-09
  • springboot aop方式实现接口入参校验的示例代码

    springboot aop方式实现接口入参校验的示例代码

    在实际开发项目中,我们常常需要对接口入参进行校验,本文主要介绍了springboot aop方式实现接口入参校验的示例代码,具有一定的参考价值,感兴趣的可以了解一下
    2023-08-08
  • Python中OpenCV实现查找轮廓的实例

    Python中OpenCV实现查找轮廓的实例

    本文将结合实例代码,介绍 OpenCV 如何查找轮廓、获取边界框。具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-06-06
  • Python实战之异步获取中国天气信息

    Python实战之异步获取中国天气信息

    这篇文章主要介绍了如何利用Python爬虫异步获取天气信息,用的API是中国天气网。文中的示例代码讲解详细,感兴趣的小伙伴可以动手试一试
    2022-03-03
  • 一文学会VSCode使用python

    一文学会VSCode使用python

    Pycharm用着卡还收费!何不试试VSCode!一文学会VSCode使用python,本文通过图文实例相结合给大家介绍的非常详细,需要的朋友参考下吧
    2021-08-08
  • python编写softmax函数、交叉熵函数实例

    python编写softmax函数、交叉熵函数实例

    这篇文章主要介绍了python编写softmax函数、交叉熵函数实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • face_recognition库在python的安装

    face_recognition库在python的安装

    这篇文章主要介绍了face_recognition库在python的安装,解决了一些没有安装时出现的一些错误,需要的朋友可以参考下
    2021-04-04
  • 详解如何使用python打印出多样字符

    详解如何使用python打印出多样字符

    当你第一次进入Python的世界里,学到的第一句代码是不是print("Hello World"),今天,让我们一起来开启探索print()的奇妙之旅,从最基础的打印字符用法到让它跳舞唱歌——动态显示,让我们一步步解锁print()的各种技能吧,需要的朋友可以参考下
    2024-03-03

最新评论