天天看點

python無效的類字元串_Python不規範的日期字元串處理類

我分析了形如19920203、199203、1992.02.03、1992.02、1992-02-03、1992-02、920203時間格式特征,列出了正規表達式如下:

^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$

當然這個表達式還不是很完善,隻能做簡單的切割,不能判斷日期的合法性,關于日期是否合法,我還是交給Python的時間功能來處理吧。

根據上面的正規表達式,我寫的DateParser類如下:

import re

import datetime

# ***************************************************

# *

# * Description: 非标準的日期字元串處理

# * Author: wangye 

# *

# ***************************************************

class DateParser(object):

def __init__(self):

self.pattern = re.compile(

r'^((?:19|20)?\d{2})[-.]?((?:[0-1]?|1)[0-9])[-.]?((?:[0-3]?|[1-3])[0-9])?$'

)

def __cutDate(self, date, flags):

y = date.year

m = date.month if flags[1] else 1

d = date.day if flags[2] else 1

return datetime.date(y, m, d)

def __mergeFlags(self, flags1, flags2):

l = []

length = min(len(flags1), len(flags2))

for i in range(0, length):

if flags1[i] and flags2[i]:

l.append(True)

else:

l.append(False)

return l

def parse(self, strdate):

"""

描述:時間解析方法。

參數:strdate 要分析的時間字元串,比如目标時間類型datetime(1992, 2, 3)

可以被解析的是下述字元串之一:

19920203

199203

1992.02.03

1992.02

1992-02-03

1992-02

920203

傳回值:

如果成功

元組(datetime, flags),其中datetime表示轉換完成的合法時間,

flags是标志位,表示有效位數,比如199202實際轉換了年和月,日沒有,

但是本函數将預設傳回1日,但是flags将表示為(True, True, False),

前面兩個True分别表示年和月被轉換,最後一個False表示日沒有被轉換。

如果失敗

傳回None。

"""

m = self.pattern.match(strdate)

flags = [False, False, False]

if m:

matches = list(m.groups())

flags = list(map(lambda x:True if x!=None else False, matches))

results = list(map(lambda x:int(x) if x!=None else 1, matches))

# results = list(map(lambda x:1 if x==None else x, results))

if results[0]<100:

if results[0]>9:

results[0] += 1900

else:

results[0] += 2000

return (datetime.date(results[0], results[1], results[2]), flags)

else:

return None

def convert(self, strdate, format):

"""

描述:轉換日期為指定格式。

參數:strdate 同parse方法的strdate參數。

format Python時間格式辨別,同datetime.date.strftime格式化辨別。

傳回值:

如果成功,傳回指定format格式的時間字元串。

如果失敗,傳回None。

"""

date = self.parse(strdate)

if date:

date = date[0]

return datetime.date.strftime(date, format)

else:

return None

def compare(self, strdate1, strdate2):

"""

描述:比較兩個日期。

參數:strdate1 和 strdate2 同parse方法的strdate參數

傳回值:

可以是下列值之一

-4  strdate1 無效,  strdate2 有效

-3  strdate1 有效,  strdate2 無效

-2  strdate1 和 strdate2 無效

-1  strdate1 < strdate2

0  strdate1 = strdate2

1  strdate1 > strdate2

"""

date1,flags1 = self.parse(strdate1)

date2,flags2 = self.parse(strdate2)

if date1 == None and date2 != None:

return -4

if date1 != None and date2 == None:

return -3

elif date1 == None and date2 == None:

return -2

flags = self.__mergeFlags(flags1, flags2)

date1 = self.__cutDate(date1, flags)

date2 = self.__cutDate(date2, flags)

if date1>date2:

return 1

elif date1

return -1

else:

return 0

下面舉幾個例子供大家參考:

>>> DateParser().parse("19860126")

(datetime.date(1986, 1, 26), [True, True, True])

>>> DateParser().parse("199111")

(datetime.date(1991, 11, 1), [True, True, False])

>>> DateParser().parse("1991")

(datetime.date(1919, 9, 1), [True, True, True])

>>> DateParser().parse("8511")

(datetime.date(1985, 11, 1), [True, True, False])

>>> DateParser().convert("19911101", "%Y * %m * %d")

'1991 * 11 * 01'

>>> DateParser().convert("1990.1.01", "%Y.%m.%d")

'1990.01.01'

>>> DateParser().compare("1992.2", "19922")

>>> DateParser().compare("1992.2", "1956.03.1")

1