python如何获取.csv文件中的某一列或者某些列
更新时间:2024年02月04日 09:28:18 作者:MqtGhj
这篇文章主要介绍了python如何获取.csv文件中的某一列或者某些列问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
获取.csv文件某一列或者某些列
1.把三个csv文件中
的feature值整合到一个文件中,同时添加相应的label。
# -*-coding:utf-8 -*- import csv; label1 = '1' label2 = '2' label3 = '3' a = "feature1,feature2,feature3,feature4,feature5,feature6,feature7,feature8,feature9,feature10,label" + "\n" with open("./dataset/dataTime2.csv", 'a') as rfile: rfile.writelines(a) with open("./dataset/f02.csv", 'rb') as file: a = file.readline().strip() while a: a = a + ',' + label1 + "\n" #a = label1 + ',' + a + "\n" with open("./dataset/dataTime2.csv", 'a') as rfile: rfile.writelines(a) a = file.readline().strip() with open("./dataset/g03.csv", 'rb') as file: a = file.readline().strip() while a: a = a + ',' + label2 + "\n" #a = label2 + ',' + a + "\n" with open("./dataset/dataTime2.csv", 'a') as rfile: rfile.writelines(a) a = file.readline().strip() with open("./dataset/normal05.csv", 'rb') as file: a = file.readline().strip() while a: a = a + ',' + label3 + "\n" #a = label3 + ',' + a + "\n" with open("./dataset/dataTime2.csv", 'a') as rfile: rfile.writelines(a) a = file.readline().strip()
2.获取csv文件中某一列
下面可以获得label为表头的列中对应的所有数值。
filename = "./dataset/dataTime2.csv" list1 = [] with open(filename, 'r') as file: reader = csv.DictReader(file) column = [row['label'] for row in reader]
3.获取csv文件中某些列
下面可以获得除label表头的对应列之外所有数值。
import pandas as pd odata = pd.read_csv(filename) y = odata['label'] x = odata.drop(['label'], axis=1) #除去label列之外的所有feature值
4.也可以处理成list[np.array]形式的数据
filename = "./dataset/dataTime2.csv" list1 = [] with open(filename, 'r') as file: a = file.readline() while a: c = np.array(a.strip("\n").split(",")) list1.append(c)
5.也可以处理成tensor格式数据集
# -*-coding:utf-8 -*- import tensorflow as tf # 读取的时候需要跳过第一行 filename = tf.train.string_input_producer(["./dataset/dataTime.csv"]) reader = tf.TextLineReader(skip_header_lines=1) key, value = reader.read(filename) record_defaults = [[1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], tf.constant([], dtype=tf.int32)] col1, col2, col3, col4, col5, col6, col7, col8, col9, col10, col11= tf.decode_csv( value, record_defaults=record_defaults) features = tf.stack([col1, col2, col3, col4, col5, col6, col7, col8, col9, col10]) with tf.Session() as sess: # Start populating the filename queue. coord = tf.train.Coordinator() threads = tf.train.start_queue_runners(coord=coord) trainx = [] trainy = [] for i in range(81000): # Retrieve a single instance: example, label = sess.run([features, col11]) trainx.append(example) trainy.append(label) coord.request_stop() coord.join(threads) #最后长度是81000,trainx是10个特征
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
Python利用matplotlib绘制圆环图(环形图)的实战案例
环形图也被称为圆环图,它在功能上与饼图相同,只是中间有一个空白,并且能够同时支持多个统计数据,下面这篇文章主要给大家介绍了关于Python利用matplotlib绘制圆环图的实战案例,文中通过实例代码介绍的非常详细,需要的朋友可以参考下2022-08-08python 实现将小图片放到另一个较大的白色或黑色背景图片中
今天小编就为大家分享一篇python 实现将小图片放到另一个较大的白色或黑色背景图片中,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2019-12-12Python pkg_resources模块动态加载插件实例分析
当编写应用软件时,我们通常希望程序具有一定的扩展性,额外的功能——甚至所有非核心的功能,都能通过插件实现,具有可插拔性。特别是使用 Python 编写的程序,由于语言本身的动态特性,为我们的插件方案提供了很多种实现方式2022-08-08解决python报错:AttributeError: 'ImageDraw' object h
这篇文章主要给大家介绍了关于解决python报错:AttributeError: 'ImageDraw' object has no attribute 'textbbox'的相关资料,文中通过图文介绍的非常详细,需要的朋友可以参考下2024-01-01
最新评论