Pandas讀取Excel日期資料的異常處理

2022-09-07 17:38:08

作者：小小明

異常描述

有時我們的Excel有一個調整過自定義格式的日期字段：

當我們用pandas讀取時卻是這樣的效果：

不管如何指定參數都無效。

出現原因

沒有使用系統内置的日期單元格格式，自定義格式沒有對負數格式進行定義，pandas讀取時無法識别出是日期格式，而是讀取出單元格實際存儲的數值。

解決方案：修改自定義格式

可以修改為系統内置的自定義格式：

或者在自定義格式上補充負數的定義：

增加;@即可

pandas直接解析Excel數值為日期

有時這種Excel很多，我們需要通過pandas批量讀取，挨個人工修改Excel的自定義格式費時費力，下面我示範如何使用pandas直接解析這些數值成為日期格式。

excel中正常格式和日期格式的轉換規則如下：

1900/1/1為起始日期，轉換的數字是1，往後的每一天增加1

1900/1/2轉換為數字是 2

1900/1/3轉換為數字是 3

1900/1/4轉換為數字是 4

以此類推

excel中時間轉換規則如下：

在時間中的規則是把1天轉換為數字是 1

每1小時就是 1/24

每1分鐘就是 1/(24×60)=1/1440

每1秒鐘就是 1/(24×60×60)=1/86400

根據Excel的日期存儲規則，我們隻需要以1900/1/1為基準日期，根據數值n偏移n-1天即可得到實際日期。不過還有個問題，Excel多存儲了1900年2月29日這一天，而正常的月曆是沒有這一天的，而我們的日期又都是大于1900年的，是以應該偏移n-2天，幹脆使用1899年12月30日作為基準，這樣不需要作減法操作。

解析代碼如下：

import pandas as pd
from pandas.tseries.offsets import Day

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.apply(lambda x: f"{x.month}月{x.day}日")
df.head()

日期
6月8日
1	6月9日
2	6月10日
3	6月11日
4	6月12日

如果需要調用time的strftime方法，由于包含中文則需要設定locale：

import pandas as pd
from pandas.tseries.offsets import Day
import locale
locale.setlocale(locale.LC_CTYPE, 'chinese')

df = pd.read_excel("日期.xlsx")
basetime = pd.to_datetime("1899/12/30")
df.日期 = df.日期.apply(lambda x: basetime+Day(x))
df.日期 = df.日期.dt.strftime('%Y年%m月%d日')
df.head()

日期
2021年06月08日
1	2021年06月09日
2	2021年06月10日
3	2021年06月11日

Pandas讀取Excel日期資料的異常處理

異常描述

出現原因

解決方案：修改自定義格式

pandas直接解析Excel數值為日期

繼續閱讀

Android--Selector、shape詳解（整理）

listview實作圓角

安卓自定義View----實作TextView可設定drawable寬高度前言drawable大小的實作原理自定義TextView----XXDrawableTextView 總結：

适用于自動駕駛 (ADAS) 平台的ASIL-Ready 智能供電與監控解決方案

make[1]: *** 沒有規則可以建立“arch/x86/syscalls/../include/generated/uapi/asm/unistd_32.h”需要的目标“/usr/src/lin

RabbitMQ：消費端自定義監聽

@linux檢視使用者操作的記錄

入門單塊效果器推薦。大家好，我是木弦。今天給大家介紹一下我平時在練琴和演出中使用的裝置。我有一個自己的單塊矩陣，它不是簡

解決Mac OS 更新至10.10 Yosemite後Python IDE Pycharm 3.4 閃退問題

歡迎使用CSDN-markdown編輯器Spring源碼編譯，導入Eclipse缺少包

歡迎使用CSDN-markdown編輯器mysql輸入密碼顯示1045的解決方法

[解決方案]Window 2008 R2 + IIS7.5 + VS2013 錯誤代碼 0x80070002

自己遇到的錯誤以及自己的解決方案

【Ubuntu報錯】ModuleNotFoundError: No module named 'gdbm'

win8離線和線上均無法安裝.net framework 3.5 問題解決方案1 Win8/8.1無法安裝.net framework3.5的解決方法2 使用dism指令安裝時存在的問題解決方案

智慧文旅數字孿生解決方案