如何用pandas读取一个文件或某个文件夹下所有文件

 更新时间:2024年02月01日 10:25:23   作者:旺仔的算法coding笔记  
这篇文章主要介绍了如何用pandas读取一个文件或某个文件夹下所有文件问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas读取一个文件或某个文件夹下所有文件

读取一个文件

直接用文件路径。

如果是读取某个文件夹下的所有文件,注意用os.path,逐个读取文件,把新读取到的Dataframe进行concate操作到总的Dataframe中去。

详细请见代码。

 
character_list =['1010011_i_u_prov',  '9010081_i_b_location']
#这是读取一个文件的,
# data=pd.read_csv('../data/10line_of_part-00000',sep='\t',header=None)
# 如果读取所有文件呢?如下
 
file_dir="../data/dt=20200807"
all_file_list=os.listdir(file_dir)
for single_file in all_file_list:
    # 逐个读取 
    single_data_frame=pd.read_csv(
            os.path.join(file_dir,single_file),sep='\t',header=None)
	if single_file ==all_file_list[0]:
		all_data_frame=single_data_frame
	else:  #进行concat操作       
         all_data_frame=pd.concat([all_data_frame,
                    single_data_frame],ignore_index=True)
 
# data.columns=character_list,给dataframe的属性重新命名。
all_data_frame.columns=character_list

备注:

data数据是从sql中select出来的结果。

注意:

分隔符要用\t,不然会报错!

pandas读取多个文件并合并到一起

先把文件位置放到一起,读取文件,再concat。

subdir=‘store'

file_names = []#存文件名
file_names.append(test1.csv')#继续添加文件名

csv_paths = []#存文件位置
for file_name in file_names:
    csv_path = join( '..','csv', subdir, file_name)#文件位置
    csv_paths.append(csv_path)
    break

df_csvs = []
for csv_path in csv_paths:
    df_tmp = pd.read_csv('%s' % csv_path, low_memory=False)
    df_csvs.append(df_tmp)
    
df_total = pd.concat(df_csvs)#合并成一个dataframe

#小技巧 非必须

#如列名为a.uid想改为uid 用以下方法操作

df_total.columns = [s[2:] for s in df_total.columns]
df_total.shape

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python3.7环境下安装Anaconda的教程图解

    python3.7环境下安装Anaconda的教程图解

    这篇文章主要介绍了python3.7环境下安装Anaconda的教程,本文图文并茂给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-09-09
  • jupyter notebook 写代码自动补全的实现

    jupyter notebook 写代码自动补全的实现

    这篇文章主要介绍了jupyter notebook 写代码自动补全的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • Kwargs传递给Python 中的另一个函数实现方法

    Kwargs传递给Python 中的另一个函数实现方法

    Python 列出了可以传递给程序中的函数的两种类型的参数, 非关键字参数**args和关键字参数 **kwargs ,在本文中,我们将讨论如何使用关键字参数及如何将关键字参数传递给另一个函数,感兴趣的朋友跟随小编一起看看吧
    2023-08-08
  • python 弹窗提示警告框MessageBox的实例

    python 弹窗提示警告框MessageBox的实例

    今天小编就为大家分享一篇python 弹窗提示警告框MessageBox的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • Python hashlib模块的使用示例

    Python hashlib模块的使用示例

    这篇文章主要介绍了Python hashlib模块的相关资料,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-10-10
  • python 命名规范知识点汇总

    python 命名规范知识点汇总

    这里给大家分享的是在python开发过程中需要注意的命名的规范的知识汇总,有需要的小伙伴可以查看下
    2020-02-02
  • python 读取视频,处理后,实时计算帧数fps的方法

    python 读取视频,处理后,实时计算帧数fps的方法

    今天小编就为大家分享一篇python 读取视频,处理后,实时计算帧数fps的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python实现打印彩色字符串的方法详解

    Python实现打印彩色字符串的方法详解

    print 也许是我们在使用 Python 的时候用的最多的一种操作,但是经常发现很多人可以打印彩色文本,这种操作是怎么得到的呢?本文就来为大家详细讲讲
    2022-08-08
  • Linux下Pycharm、Anaconda环境配置及使用踩坑

    Linux下Pycharm、Anaconda环境配置及使用踩坑

    这篇文章主要介绍了Linux下Pycharm、Anaconda环境配置及使用踩坑,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-12-12
  • python利用lxml库剩下操作svg图片

    python利用lxml库剩下操作svg图片

    在大多数场景中,我们都用 lxml 库解析网页源码,但你是否知道,lxml 库也是可以操作 svg 图片的。本文就来和大家聊聊具体操作方法,希望对大家有所帮助
    2023-01-01

最新评论