題目描述:
給定一個段落 (paragraph) 和一個禁用單詞清單 (banned)。傳回出現次數最多,同時不在禁用清單中的單詞。題目保證至少有一個詞不在禁用清單中,而且答案唯一。
禁用清單中的單詞用小寫字母表示,不含标點符号。段落中的單詞不區分大小寫。答案都是小寫字母。
輸入樣例:
輸入:
paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
banned = ["hit"]
輸出: "ball"
解釋:
"hit" 出現了3次,但它是一個禁用的單詞。
"ball" 出現了2次 (同時沒有其他單詞出現2次),是以它是段落裡出現次數最多的,且不在禁用清單中的單詞。
注意,所有這些單詞在段落裡不區分大小寫,标點符号需要忽略(即使是緊挨着單詞也忽略, 比如 "ball,"),
"hit"不是最終的答案,雖然它出現次數更多,但它在禁用單詞清單中。
說明:
1 <= 段落長度 <= 1000.
1 <= 禁用單詞個數 <= 100.
1 <= 禁用單詞長度 <= 10.
答案是唯一的, 且都是小寫字母 (即使在 paragraph 裡是大寫的,即使是一些特定的名詞,答案都是小寫的。)
paragraph 隻包含字母、空格和下列标點符号!?',;.
不存在沒有連字元或者帶有連字元的單詞。
單詞裡隻包含字母,不會出現省略号或者其他标點符号。
class Solution {
public:
string mostCommonWord(string paragraph, vector<string>& banned) {
set<string> ban(banned.begin(),banned.end());//set可以自動去除重複字元串
map<string,int> count;
for(char &c:paragraph){
c=isalpha(c)?tolower(c):' ';//isalpha用于判斷是否是字母,tolower大寫字母轉小寫字母,小寫字母不變
}
stringstream ss(paragraph);//stringstream可以按照空格将字元串分割
string temp;
pair<string,int> res("",0);//将不同類型的資料,整合成一個資料,pair.first是第一個資料,pair.second是第二個資料
while(ss>>temp){
if(count.find(temp)==count.end())
count[temp]=1;
else
count[temp]+=1;
if(ban.find(temp)==ban.end()&&count[temp]>res.second){
res=make_pair(temp,count[temp]);//将一對資料放到pair中
}
}
return res.first;
}
};