Python描述 LeetCode 819. 最常見的單詞
大家好,我叫亓官劼(qí guān jié )
給定一個段落 (paragraph) 和一個禁用單詞清單 (banned)。傳回出現次數最多,同時不在禁用清單中的單詞。
題目保證至少有一個詞不在禁用清單中,而且答案唯一。
禁用清單中的單詞用小寫字母表示,不含标點符号。段落中的單詞不區分大小寫。答案都是小寫字母。
輸入:
paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
banned = ["hit"]
輸出: "ball"
解釋:
"hit" 出現了3次,但它是一個禁用的單詞。
"ball" 出現了2次 (同時沒有其他單詞出現2次),是以它是段落裡出現次數最多的,且不在禁用清單中的單詞。
注意,所有這些單詞在段落裡不區分大小寫,标點符号需要忽略(即使是緊挨着單詞也忽略, 比如 "ball,"),
"hit"不是最終的答案,雖然它出現次數更多,但它在禁用單詞清單中。
-
1 <= 段落長度 <= 1000
-
0 <= 禁用單詞個數 <= 100
-
1 <= 禁用單詞長度 <= 10
- 答案是唯一的, 且都是小寫字母 (即使在
裡是大寫的,即使是一些特定的名詞,答案都是小寫的。)paragraph
-
隻包含字母、空格和下列标點符号paragraph
!?',;.
- 不存在沒有連字元或者帶有連字元的單詞。
- 單詞裡隻包含字母,不會出現省略号或者其他标點符号。
算法實作
class Solution:
def mostCommonWord(self, paragraph: str, banned: List[str]) -> str:
tmp = re.findall('[A-Za-z]+',paragraph)
data = {}
for item in tmp:
if item.lower() not in data:
data[item.lower()] = 1
else:
data[item.lower()] = data[item.lower()] + 1
data = sorted(list(data.items()),key=lambda x:x[1],reverse=True)
for item in data:
if item[0] not in banned:
return item[0]