天天看點

LeetCode_819_最常見的單詞

題目描述:

給定一個段落 (paragraph) 和一個禁用單詞清單 (banned)。傳回出現次數最多,同時不在禁用清單中的單詞。題目保證至少有一個詞不在禁用清單中,而且答案唯一。

禁用清單中的單詞用小寫字母表示,不含标點符号。段落中的單詞不區分大小寫。答案都是小寫字母。

輸入樣例:
輸入: 
paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
banned = ["hit"]
輸出: "ball"
解釋: 
"hit" 出現了3次,但它是一個禁用的單詞。
"ball" 出現了2次 (同時沒有其他單詞出現2次),是以它是段落裡出現次數最多的,且不在禁用清單中的單詞。 
注意,所有這些單詞在段落裡不區分大小寫,标點符号需要忽略(即使是緊挨着單詞也忽略, 比如 "ball,"), 
"hit"不是最終的答案,雖然它出現次數更多,但它在禁用單詞清單中。
說明:
1 <= 段落長度 <= 1000.
1 <= 禁用單詞個數 <= 100.
1 <= 禁用單詞長度 <= 10.
答案是唯一的, 且都是小寫字母 (即使在 paragraph 裡是大寫的,即使是一些特定的名詞,答案都是小寫的。)
paragraph 隻包含字母、空格和下列标點符号!?',;.
不存在沒有連字元或者帶有連字元的單詞。
單詞裡隻包含字母,不會出現省略号或者其他标點符号。      
class Solution {
public:
    string mostCommonWord(string paragraph, vector<string>& banned) {
        set<string> ban(banned.begin(),banned.end());//set可以自動去除重複字元串
        map<string,int> count;
        for(char &c:paragraph){
            c=isalpha(c)?tolower(c):' ';//isalpha用于判斷是否是字母,tolower大寫字母轉小寫字母,小寫字母不變
        }
        stringstream ss(paragraph);//stringstream可以按照空格将字元串分割
        string temp;
        pair<string,int> res("",0);//将不同類型的資料,整合成一個資料,pair.first是第一個資料,pair.second是第二個資料
        while(ss>>temp){
            if(count.find(temp)==count.end())
                count[temp]=1;
            else
                count[temp]+=1;
            if(ban.find(temp)==ban.end()&&count[temp]>res.second){
                res=make_pair(temp,count[temp]);//将一對資料放到pair中
            }
        }
        return res.first;
    }
};