python 使用pandas读取csv文件的方法
在这里记录一下,python使用pandas读取文件的方法
用到pandas库的read_csv函数
# -*- coding: utf-8 -*- """ Created on Mon Jan 24 16:48:32 2022 @author: zxy """ # 导入包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import matplotlib.gridspec as gridspec import seaborn as sns; plt.style.use('ggplot') import sklearn from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split from sklearn.utils import shuffle from sklearn.metrics import confusion_matrix from sklearn.manifold import TSNE # 导入并查看数据 crecreditcard_data=pd.read_csv('./creditcard.csv') crecreditcard_data.shape,crecreditcard_data.info() crecreditcard_data.describe() crecreditcard_data.head() # 看看欺诈与非欺诈的比例如何 count_classes=pd.value_counts(crecreditcard_data['Class'],sort=True).sort_index() # 统计下具体数据 count_classes.value_counts() # 也可以用count_classes[0],count_classes[1]看分别数据 count_classes.plot(kind='bar') plt.show()
知识点扩展:
pandas读取csv文件的操作
1. 读取csv文件
import pandas as pd import numpy as np # 读取整个csv文件 csv_data = pd.read_csv("./stock_day.csv") # 读取指定列索引字段的数据 csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close']) # 将我们修改完的csv的文件保存到新的路径下 csv_data.to_csv('demo.csv')
观察我们保存的文件的格式(行索引为我们的日期, 列索引为 open close) :
# 查看新保存的文件 new_data = read_csv('./demo.csv')
观察新保存的文件(我们在读取的时候默认给我们添加了新的行索引, 及Unnamed:0):
使用to_csv的时候, 我们可以给他传入几个参数:
csv_data.to_csv('demo.csv', header=True, index=False)
to_csv这个方法中可以传递一些参数:
DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)
- path_or_buf :文件保存的路径;
- sep :默认是以 , 进行分割 , 也可以自己制定;
- columns : 保存索引列和指定列;
- index:是否写进行索引 0或者1;
- header :boolean or list of string, default True,是否写进列索引值 0或者 1;
- na_rep=NaN: 缺失值保存为Na 如果不写 默认为空;
- float_format='%.2f' :保留两位小数;
再来回顾一下将我们的行索引装成日期格式的方法:
# 生成一个时间的序列,略过周末非交易日 date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B') # index代表行索引,columns代表列索引 new_data = pd.DataFrame(new_data, index=date)
到此这篇关于python 使用pandas读取csv文件的方法的文章就介绍到这了,更多相关python 读取csv文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
- Python pymysql连接数据库并将查询结果转化为Pandas dataframe
- Python Pandas创建Dataframe数据框的六种方法汇总
- python中pandas库的iloc函数用法解析
- Python实践之使用Pandas进行数据分析
- 如何使用 Python Pandas 更新行和列
- Python 中 Pandas 文件操作和读取 CSV 参数详解
- Python使用Pandas处理测试数据的方法
- Python pandas中read_csv参数示例详解
- Python使用pandas导入xlsx格式的excel文件内容操作代码
- python使用pandas读取json文件并进行刷选导出xlsx文件的方法示例
相关文章
在Python 3中缓存Exception对象会造成什么后果?
这篇文章主要介绍了在Python 3中缓存Exception对象到底会造成什么后果?下面带着这个问题一起看看文章的解析,需要的朋友可以参考一下2021-12-12解决pyecharts运行后产生的html文件用浏览器打开空白
这篇文章主要介绍了解决pyecharts运行后产生的html文件用浏览器打开空白,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2020-03-03python的scipy.stats模块中正态分布常用函数总结
在本篇内容里小编给大家整理的是一篇关于python的scipy.stats模块中正态分布常用函数总结内容,有兴趣的朋友们可以学习参考下。2021-02-02
最新评论