python用pd.read_csv()方法来读取csv文件的实现
csv文件是一种用,和换行符区分数据记录和字段的一种文件结构,可以用excel表格编辑,也可以用记事本编辑,是一种类excel的数据存储文件,也可以看成是一种数据库。pandas提供了pd.read_csv()方法可以读取其中的数据并且转换成DataFrame数据帧。python的强大之处就在于他可以把不同的数据库类型,比如txt/csv/.xls/.sql转换成统一的DataFrame格式然后进行统一的处理。真是做到了标准化。我们可以用以下代码来演示csv文件的读取操作。
import pandas as pd data1 = pd.read_csv('rating.csv') print(data1) print("************取消第一行作为表头*************") data2 = pd.read_csv('rating.csv',header=None) print(data2) print("************为各个字段取名**************") data3 = pd.read_csv('rating.csv',names=['user_id','book_id','rating']) print(data3) print("***********将某一字段设为索引***************") data3 = pd.read_csv('rating.csv', names=['user_id','book_id','rating'], index_col = "user_id") print(data3) print("************用sep参数设置分隔符**************") data4 = pd.read_csv('rating.csv', names=['user_id','book_id','rating'], sep=',') print(data4) print("************自动补全缺失数据为NaN**************") data5 = pd.read_csv('data.csv',header=None) print(data5)
输出的结果如下:
1 258 5
0 2 4081 4
1 2 260 5
2 2 9296 5
3 2 2318 3
4 2 26 4
5 2 315 3
6 2 33 4
7 2 301 5
************取消第一行作为表头*************
0 1 2
0 1 258 5
1 2 4081 4
2 2 260 5
3 2 9296 5
4 2 2318 3
5 2 26 4
6 2 315 3
7 2 33 4
8 2 301 5
************为各个字段取名**************
user_id book_id rating
0 1 258 5
1 2 4081 4
2 2 260 5
3 2 9296 5
4 2 2318 3
5 2 26 4
6 2 315 3
7 2 33 4
8 2 301 5
***********将某一字段设为索引***************
book_id rating
user_id
1 258 5
2 4081 4
2 260 5
2 9296 5
2 2318 3
2 26 4
2 315 3
2 33 4
2 301 5
************用sep参数设置分隔符**************
user_id book_id rating
0 1 258 5
1 2 4081 4
2 2 260 5
3 2 9296 5
4 2 2318 3
5 2 26 4
6 2 315 3
7 2 33 4
8 2 301 5
************自动补全缺失数据为NaN**************
0 1 2 3 4
0 1 2.0 3 4.0 5
1 6 7.0 8 NaN 10
2 11 NaN 13 14.0 15
[Finished in 4.5s]
对代码的具体解释,可以参考星号隔离bar中的注释。
到此这篇关于python用pd.read_csv()方法来读取csv文件的实现的文章就介绍到这了,更多相关python读取csv文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
在Python中使用MongoEngine操作数据库教程实例
这篇文章主要介绍了在Python中使用MongoEngine操作数据库教程实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下2019-12-12Python pomegranate库实现基于贝叶斯网络拼写检查器
这篇文章主要为大家介绍了Python pomegranate库实现基于贝叶斯网络拼写检查器示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪<BR>2023-04-04爬虫代理池Python3WebSpider源代码测试过程解析
这篇文章主要介绍了爬虫代理池Python3WebSpider源代码测试过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下2019-12-12关于Python中的if __name__ == __main__详情
在学习Python的过程中发现即使把if __name__ == ‘__main__’ 去掉,程序还是照样运行。很多小伙伴只知道是这么用的,也没有深究具体的作用。这篇文字就来介绍一下Python中的if __name__ == ‘__main__’的作用,需要的朋友参考下文2021-09-09
最新评论