解决pandas read_csv 读取中文列标题文件报错的问题

 更新时间:2018年06月15日 09:46:56   作者:wshzd  
今天小编就为大家分享一篇解决pandas read_csv 读取中文列标题文件报错的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

从windows操作系统本地读取csv文件报错

data = pd.read_csv(path)
Traceback (most recent call last):

 File "C:/Users/arron/PycharmProjects/ML/ML/test.py", line 45, in <module>
  data = pd.read_csv(path)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 655, in parser_f
  return _read(filepath_or_buffer, kwds)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 405, in _read
  parser = TextFileReader(filepath_or_buffer, **kwds)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 762, in __init__
  self._make_engine(self.engine)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 966, in _make_engine
  self._engine = CParserWrapper(self.f, **self.options)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1582, in __init__
  self._reader = parsers.TextReader(src, **kwds)
 File "pandas\_libs\parsers.pyx", line 394, in pandas._libs.parsers.TextReader.__cinit__ (pandas\_libs\parsers.c:4209)
 File "pandas\_libs\parsers.pyx", line 712, in pandas._libs.parsers.TextReader._setup_parser_source (pandas\_libs\parsers.c:8895)
OSError: Initializing from file failed

上述报错的解决方案是

pwd = os.getcwd()
os.chdir(os.path.dirname(path))
data = pd.read_csv(os.path.basename(path))
os.chdir(pwd)

此时又报如下错误:

Traceback (most recent call last):
 File "C:/Users/arron/PycharmProjects/ML/ML/test.py", line 47, in <module>
  data = pd.read_csv(os.path.basename(path))
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 655, in parser_f
  return _read(filepath_or_buffer, kwds)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 405, in _read
  parser = TextFileReader(filepath_or_buffer, **kwds)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 762, in __init__
  self._make_engine(self.engine)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 966, in _make_engine
  self._engine = CParserWrapper(self.f, **self.options)
 File "C:\Users\arron\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\io\parsers.py", line 1582, in __init__
  self._reader = parsers.TextReader(src, **kwds)
 File "pandas\_libs\parsers.pyx", line 562, in pandas._libs.parsers.TextReader.__cinit__ (pandas\_libs\parsers.c:6175)
 File "pandas\_libs\parsers.pyx", line 781, in pandas._libs.parsers.TextReader._get_header (pandas\_libs\parsers.c:9691)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd7 in position 0: invalid continuation byte

最终解决方案是:

pwd = os.getcwd()
os.chdir(os.path.dirname(path))
data = pd.read_csv(os.path.basename(path),encoding='gbk')
os.chdir(pwd)

以上这篇解决pandas read_csv 读取中文列标题文件报错的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • windows下添加Python环境变量的方法汇总

    windows下添加Python环境变量的方法汇总

    默认情况下,在windows下安装python之后,系统并不会自动添加相应的环境变量。此时不能在命令行直接使用python命令。今天我们就来看下,如何简单快捷的在windows下添加Python环境变量
    2018-05-05
  • Python FtpLib模块应用操作详解

    Python FtpLib模块应用操作详解

    这篇文章主要介绍了Python FtpLib模块应用操作,结合实例形式详细分析了FtpLib模块的功能、配置、应用相关操作技巧与使用注意事项,需要的朋友可以参考下
    2019-12-12
  • Python读取mat文件,并保存为pickle格式的方法

    Python读取mat文件,并保存为pickle格式的方法

    今天小编就为大家分享一篇Python读取mat文件,并保存为pickle格式的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • 详解Numpy中的广播原则/机制

    详解Numpy中的广播原则/机制

    这篇文章主要介绍了Numpy中的广播原则/机制,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-09-09
  • keras的load_model实现加载含有参数的自定义模型

    keras的load_model实现加载含有参数的自定义模型

    这篇文章主要介绍了keras的load_model实现加载含有参数的自定义模型,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • python中的变量与内存用法

    python中的变量与内存用法

    这篇文章主要介绍了python变量与内存用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • Python二进制数据结构Struct的具体使用

    Python二进制数据结构Struct的具体使用

    在C/C++语言中,struct被称为结构体。而在Python中,struct是一个专门的库,用于处理字节串与原生Python数据结构类型之间的转换。本文就详细介绍struct的使用方式
    2021-06-06
  • python简单实现基数排序算法

    python简单实现基数排序算法

    这篇文章主要介绍了python简单实现基数排序算法,仅用4行代码即可实现基数排序算法,非常简单实用,需要的朋友可以参考下
    2015-05-05
  • python可视化大屏库big_screen示例详解

    python可视化大屏库big_screen示例详解

    提到数据可视化,我们会想到 Plotly、Matplotlib、Pyecharts等可视化库,或者一些商用软件Tableau、FineBI等等。如果你希望操作更简单、展现效果更强大,那么这款工具 big_screen 更适合
    2021-11-11
  • python正则表达式(re模块)的使用详解

    python正则表达式(re模块)的使用详解

    正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,下面这篇文章主要给大家介绍了关于python正则表达式(re模块)使用的相关资料,需要的朋友可以参考下
    2022-03-03

最新评论