天天看點

Python描述 LeetCode 819. 最常見的單詞

Python描述 LeetCode 819. 最常見的單詞

  大家好,我叫亓官劼(qí guān jié )

給定一個段落 (paragraph) 和一個禁用單詞清單 (banned)。傳回出現次數最多,同時不在禁用清單中的單詞。

題目保證至少有一個詞不在禁用清單中,而且答案唯一。

禁用清單中的單詞用小寫字母表示,不含标點符号。段落中的單詞不區分大小寫。答案都是小寫字母。

輸入: 
paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
banned = ["hit"]
輸出: "ball"
解釋: 
"hit" 出現了3次,但它是一個禁用的單詞。
"ball" 出現了2次 (同時沒有其他單詞出現2次),是以它是段落裡出現次數最多的,且不在禁用清單中的單詞。 
注意,所有這些單詞在段落裡不區分大小寫,标點符号需要忽略(即使是緊挨着單詞也忽略, 比如 "ball,"), 
"hit"不是最終的答案,雖然它出現次數更多,但它在禁用單詞清單中。      
  • ​1 <= 段落長度 <= 1000​

  • ​0 <= 禁用單詞個數 <= 100​

  • ​1 <= 禁用單詞長度 <= 10​

  • 答案是唯一的, 且都是小寫字母 (即使在​

    ​paragraph​

    ​ 裡是大寫的,即使是一些特定的名詞,答案都是小寫的。)
  • ​paragraph​

    ​​ 隻包含字母、空格和下列标點符号​

    ​!?',;.​

  • 不存在沒有連字元或者帶有連字元的單詞。
  • 單詞裡隻包含字母,不會出現省略号或者其他标點符号。

算法實作

class Solution:
    def mostCommonWord(self, paragraph: str, banned: List[str]) -> str:
        tmp = re.findall('[A-Za-z]+',paragraph)
        data = {}
        for item in tmp:
            if item.lower() not in data:
                data[item.lower()] = 1
            else:
                data[item.lower()] = data[item.lower()] + 1
        data = sorted(list(data.items()),key=lambda x:x[1],reverse=True)
        for item in data:
            if item[0] not in banned:
                return item[0]