天天看点

python怎么判断标点_Python正则表达式标点识别

我被这个难住了。我只是在学习正则表达式,不明白为什么它不会返回标点符号。在

以下是正则表达式正在解析的文本文件:

4月/NNP

是/VBZ

日期

最残酷/JJ

月/NN

,/,

育种/VBG

丁香/NNP

输出/RB

共/英寸

日期

死亡/JJ

土地/NNtext = open_file.read()

grammarList = raw_input("Enter your grammar string: ");

tags = grammarList.split("^")

tags_pattern = r'\s+'.join(r"([\w\,\:\;\"\-\.]+)/{0}".format(re.escape(tag)) for tag in tags) + r"\b"

print tags_pattern

from re import findall

start_position = 0

for poem in poemList:

start_position = text.find('', start_position)

end_position = text.find('' + poem + '>', start_position)

searchtext = text [start_position:end_position]

poemname = poem

for oldname, newname in poemtitleswapList.items():

poemname = poemname.replace(oldname, newname)

print (poemname)

print (findall(tags_pattern, searchtext))

print ("\n")

我以为方括号里的“\,”可以让它返回一个“,”,但它不起作用。在

任何帮助都将不胜感激。在