Python Pandas读取Excel日期数据的异常处理方法

 更新时间:2022年02月28日 15:32:54   作者:小小明-代码实体  
Excel文件是传统的数据格式,但面对海量数据时,用编程的方法来处理数据更有优势,下面这篇文章主要给大家介绍了关于Python Pandas读取Excel日期数据的异常处理方法,需要的朋友可以参考下

异常描述

有时我们的Excel有一个调整过自定义格式的日期字段:

当我们用pandas读取时却是这样的效果:

不管如何指定参数都无效。

出现原因

没有使用系统内置的日期单元格格式,自定义格式没有对负数格式进行定义,pandas读取时无法识别出是日期格式,而是读取出单元格实际存储的数值。

解决方案:修改自定义格式

可以修改为系统内置的自定义格式:

或者在自定义格式上补充负数的定义:

增加;@即可

pandas直接解析Excel数值为日期

有时这种Excel很多,我们需要通过pandas批量读取,挨个人工修改Excel的自定义格式费时费力,下面我演示如何使用pandas直接解析这些数值成为日期格式。

excel中常规格式和日期格式的转换规则如下:

1900/1/1为起始日期,转换的数字是1,往后的每一天增加1

1900/1/2转换为数字是 2

1900/1/3转换为数字是 3

1900/1/4转换为数字是 4

以此类推

excel中时间转换规则如下:

在时间中的规则是把1天转换为数字是 1

每1小时就是 1/24

每1分钟就是 1/(24×60)=1/1440

每1秒钟就是 1/(24×60×60)=1/86400

根据Excel的日期存储规则,我们只需要以1900/1/1为基准日期,根据数值n偏移n-1天即可得到实际日期。不过还有个问题,Excel多存储了1900年2月29日这一天,而正常的日历是没有这一天的,而我们的日期又都是大于1900年的,所以应该偏移n-2天,干脆使用1899年12月30日作为基准,这样不需要作减法操作。

解析代码如下:

import pandas as pd
from pandas.tseries.offsets import Day

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.apply(lambda x: f"{x.month}月{x.day}日")
df.head()
 日期
06月8日
16月9日
26月10日
36月11日
46月12日

如果需要调用time的strftime方法,由于包含中文则需要设置locale:

import pandas as pd
from pandas.tseries.offsets import Day
import locale
locale.setlocale(locale.LC_CTYPE, 'chinese')

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.dt.strftime('%Y年%m月%d日')
df.head()
 日期
02021年06月08日
12021年06月09日
22021年06月10日
32021年06月11日
42021年06月12日

总结 

到此这篇关于Python Pandas读取Excel日期数据的异常处理的文章就介绍到这了,更多相关Pandas读取Excel日期数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 从零学Python之入门(五)缩进和选择

    从零学Python之入门(五)缩进和选择

    空白在Python中是重要的。事实上行首的空白是重要的。它称为缩进。在逻辑行首的空白(空格和制表符)用来决定逻辑行的缩进层次,从而用来决定语句的分组。
    2014-05-05
  • Python实现轻松识别数百个快递单号

    Python实现轻松识别数百个快递单号

    当我们要寄出很多快递时,为了及时反馈物流信息,需要尽快将快递单号提取出来。这时用手动去识别真的太麻烦,所以本文将用Python实现轻松识别数百个快递单号,需要的可以参考一下
    2022-06-06
  • python实现定时自动备份文件到其他主机的实例代码

    python实现定时自动备份文件到其他主机的实例代码

    这篇文章主要介绍了python实现定时自动备份文件到其他主机的方法,非常不错,具有参考借鉴价值,需要的朋友可以参考下
    2018-02-02
  • python如何去除字符串中不想要的字符

    python如何去除字符串中不想要的字符

    这篇文章主要为大家详细介绍了python如何去除字符串中不想要的字符,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • 只需7行Python代码玩转微信自动聊天

    只需7行Python代码玩转微信自动聊天

    今天小编就为大家分享一篇关于只需7行Python代码玩转微信自动聊天,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-01-01
  • python 列表删除所有指定元素的方法

    python 列表删除所有指定元素的方法

    下面小编就为大家分享一篇python 列表删除所有指定元素的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Windows10+anacond+GPU+pytorch安装详细过程

    Windows10+anacond+GPU+pytorch安装详细过程

    这篇文章主要介绍了Windows10+anacond+GPU+pytorch安装详细过程,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • 在Python反编译中批量pyc转 py的实现代码

    在Python反编译中批量pyc转 py的实现代码

    这篇文章主要介绍了在Python反编译中批量pyc转 py的实现代码,代码简单易懂,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-02-02
  • Python 调用GPT-3 API实现过程详解

    Python 调用GPT-3 API实现过程详解

    这篇文章主要为大家介绍了Python 调用GPT-3 API实现过程详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-02-02
  • Python Vaex实现快速分析100G大数据量

    Python Vaex实现快速分析100G大数据量

    Vaex是一个开源的DataFrame库,它可以对表格数据集进行可视化、探索、分析,甚至机器学习,这些数据集和你的硬盘驱动器一样大。本文就来聊聊如何利用Vaex实现快速分析100G大数据量,需要的可以参考一下
    2023-03-03

最新评论