天天看點

我寫了一套架構,把滑動視窗算法變成了默寫題

鑒于前文 二分搜尋架構詳解 的那首《二分搜尋升天詞》很受好評,并在民間廣為流傳,成為安睡助眠的一劑良方,今天在滑動視窗算法架構中,我再次編寫一首小詩來歌頌滑動視窗算法的偉大:

我寫了一套架構,把滑動視窗算法變成了默寫題

關于雙指針的快慢指針和左右指針的用法,可以參見前文 雙指針技巧彙總,本文就解決一類最難掌握的雙指針技巧:滑動視窗技巧。總結出一套架構,可以保你閉着眼睛都能寫出正确的解法。

PS:我認真寫了 100 多篇原創,手把手刷 200 道力扣題目,全部釋出在labuladong的算法小抄,持續更新。建議收藏,按照我的文章順序刷題,掌握各種算法套路後投再入題海就如魚得水了。

說起滑動視窗算法,很多讀者都會頭疼。這個算法技巧的思路非常簡單,就是維護一個視窗,不斷滑動,然後更新答案麼。LeetCode 上有起碼 10 道運用滑動視窗算法的題目,難度都是中等和困難。該算法的大緻邏輯如下:

int left = 0, right = 0;

while (right < s.size()) {`
    // 增大視窗
    window.add(s[right]);
    right++;

    while (window needs shrink) {
        // 縮小視窗
        window.remove(s[left]);
        left++;
    }
}      

這個算法技巧的時間複雜度是 O(N),比字元串暴力算法要高效得多。

其實困擾大家的,不是算法的思路,而是各種細節問題。比如說如何向視窗中添加新元素,如何縮小視窗,在視窗滑動的哪個階段更新結果。即便你明白了這些細節,也容易出 bug,找 bug 還不知道怎麼找,真的挺讓人心煩的。

是以今天我就寫一套滑動視窗算法的代碼架構,我連再哪裡做輸出 debug 都給你寫好了,以後遇到相關的問題,你就默寫出來如下架構然後改三個地方就行,還不會出 bug:

/* 滑動視窗算法架構 */
void slidingWindow(string s, string t) {
    unordered_map<char, int> need, window;
    for (char c : t) need[c]++;

    int left = 0, right = 0;
    int valid = 0; 
    while (right < s.size()) {
        // c 是将移入視窗的字元
        char c = s[right];
        // 右移視窗
        right++;
        // 進行視窗内資料的一系列更新
        ...

        /*** debug 輸出的位置 ***/
        printf("window: [%d, %d)\n", left, right);
        /********************/

        // 判斷左側視窗是否要收縮
        while (window needs shrink) {
            // d 是将移出視窗的字元
            char d = s[left];
            // 左移視窗
            left++;
            // 進行視窗内資料的一系列更新
            ...
        }
    }
}      

其中兩處 

...

 表示的更新視窗資料的地方,到時候你直接往裡面填就行了。

而且,這兩個 

...

 處的操作分别是右移和左移視窗更新操作,等會你會發現它們操作是完全對稱的。

說句題外話,我發現很多人喜歡執着于表象,不喜歡探求問題的本質。比如說有很多人評論我這個架構,說什麼散清單速度慢,不如用數組代替散清單;還有很多人喜歡把代碼寫得特别短小,說我這樣代碼太多餘,影響編譯速度,LeetCode 上速度不夠快。

我服了。算法看的是時間複雜度,你能確定自己的時間複雜度最優,就行了。至于 LeetCode 所謂的運作速度,那個都是玄學,隻要不是慢的離譜就沒啥問題,根本不值得你從編譯層面優化,不要舍本逐末……

labuladong 公衆号的重點在于算法思想,你把架構思維了然于心,然後随你魔改代碼好吧,你高興就好。

言歸正傳,下面就直接上四道 LeetCode 原題來套這個架構,其中第一道題會詳細說明其原理,後面四道就直接閉眼睛秒殺了。

本文代碼為 C++ 實作,不會用到什麼程式設計方面的奇技淫巧,但是還是簡單介紹一下一些用到的資料結構,以免有的讀者因為語言的細節問題阻礙對算法思想的了解:

unordered_map

 就是哈希表(字典),它的一個方法 

count(key)

 相當于 Java 的 

containsKey(key)

 可以判斷鍵 key 是否存在。

可以使用方括号通路鍵對應的值 

map[key]

。需要注意的是,如果該 

key

 不存在,C++ 會自動建立這個 key,并把 

map[key]

 指派為 0。

是以代碼中多次出現的 

map[key]++

map.put(key, map.getOrDefault(key, 0) + 1)

一、最小覆寫子串

LeetCode 76 題,Minimum Window Substring,難度 Hard:

我寫了一套架構,把滑動視窗算法變成了默寫題

就是說要在 

S

(source) 中找到包含 

T

(target) 中全部字母的一個子串,且這個子串一定是所有可能子串中最短的。

如果我們使用暴力解法,代碼大概是這樣的:

for (int i = 0; i < s.size(); i++)
    for (int j = i + 1; j < s.size(); j++)
        if s[i:j] 包含 t 的所有字母:
            更新答案      

思路很直接,但是顯然,這個算法的複雜度肯定大于 O(N^2) 了,不好。

滑動視窗算法的思路是這樣:

1、我們在字元串 

S

 中使用雙指針中的左右指針技巧,初始化 

left = right = 0

,把索引左閉右開區間 

[left, right)

 稱為一個「視窗」。

2、我們先不斷地增加 

right

 指針擴大視窗 

[left, right)

,直到視窗中的字元串符合要求(包含了 

T

 中的所有字元)。

3、此時,我們停止增加 

right

,轉而不斷增加 

left

 指針縮小視窗 

[left, right)

,直到視窗中的字元串不再符合要求(不包含 

T

 中的所有字元了)。同時,每次增加 

left

,我們都要更新一輪結果。

4、重複第 2 和第 3 步,直到 

right

 到達字元串 

S

 的盡頭。

這個思路其實也不難,第 2 步相當于在尋找一個「可行解」,然後第 3 步在優化這個「可行解」,最終找到最優解,也就是最短的覆寫子串。左右指針輪流前進,視窗大小增增減減,視窗不斷向右滑動,這就是「滑動視窗」這個名字的來曆。

下面畫圖了解一下,

needs

 和 

window

 相當于計數器,分别記錄 

T

 中字元出現次數和「視窗」中的相應字元的出現次數。

初始狀态:

我寫了一套架構,把滑動視窗算法變成了默寫題

增加 

right

,直到視窗 

[left, right]

 包含了 

T

 中所有字元:

我寫了一套架構,把滑動視窗算法變成了默寫題

現在開始增加 

left

,縮小視窗 

[left, right]

我寫了一套架構,把滑動視窗算法變成了默寫題

直到視窗中的字元串不再符合要求,

left

 不再繼續移動。

我寫了一套架構,把滑動視窗算法變成了默寫題

之後重複上述過程,先移動 

right

,再移動 

left

…… 直到 

right

 指針到達字元串 

S

 的末端,算法結束。

如果你能夠了解上述過程,恭喜,你已經完全掌握了滑動視窗算法思想。現在我們來看看這個滑動視窗代碼架構怎麼用:

首先,初始化 

window

need

 兩個哈希表,記錄視窗中的字元和需要湊齊的字元:

unordered_map<char, int> need, window;
for (char c : t) need[c]++;      

然後,使用 

left

right

 變量初始化視窗的兩端,不要忘了,區間 

[left, right)

 是左閉右開的,是以初始情況下視窗沒有包含任何元素:

int left = 0, right = 0;
int valid = 0; 
while (right < s.size()) {
    // 開始滑動
}      

其中 

valid

 變量表示視窗中滿足 

need

 條件的字元個數,如果 

valid

need.size

 的大小相同,則說明視窗已滿足條件,已經完全覆寫了串 

T

現在開始套模闆,隻需要思考以下四個問題:

1、當移動 

right

 擴大視窗,即加入字元時,應該更新哪些資料?

2、什麼條件下,視窗應該暫停擴大,開始移動 

left

 縮小視窗?

3、當移動 

left

 縮小視窗,即移出字元時,應該更新哪些資料?

4、我們要的結果應該在擴大視窗時還是縮小視窗時進行更新?

如果一個字元進入視窗,應該增加 

window

 計數器;如果一個字元将移出視窗的時候,應該減少 

window

 計數器;當 

valid

 滿足 

need

 時應該收縮視窗;應該在收縮視窗的時候更新最終結果。

下面是完整代碼:

string minWindow(string s, string t) {
    unordered_map<char, int> need, window;
    for (char c : t) need[c]++;

    int left = 0, right = 0;
    int valid = 0;
    // 記錄最小覆寫子串的起始索引及長度
    int start = 0, len = INT_MAX;
    while (right < s.size()) {
        // c 是将移入視窗的字元
        char c = s[right];
        // 右移視窗
        right++;
        // 進行視窗内資料的一系列更新
        if (need.count(c)) {
            window[c]++;
            if (window[c] == need[c])
                valid++;
        }

        // 判斷左側視窗是否要收縮
        while (valid == need.size()) {
            // 在這裡更新最小覆寫子串
            if (right - left < len) {
                start = left;
                len = right - left;
            }
            // d 是将移出視窗的字元
            char d = s[left];
            // 左移視窗
            left++;
            // 進行視窗内資料的一系列更新
            if (need.count(d)) {
                if (window[d] == need[d])
                    valid--;
                window[d]--;
            }                    
        }
    }
    // 傳回最小覆寫子串
    return len == INT_MAX ?
        "" : s.substr(start, len);
}      

需要注意的是,當我們發現某個字元在 

window

 的數量滿足了 

need

 的需要,就要更新 

valid

,表示有一個字元已經滿足要求。而且,你能發現,兩次對視窗内資料的更新操作是完全對稱的。

當 

valid == need.size()

 時,說明 

T

 中所有字元已經被覆寫,已經得到一個可行的覆寫子串,現在應該開始收縮視窗了,以便得到「最小覆寫子串」。

移動 

left

 收縮視窗時,視窗内的字元都是可行解,是以應該在收縮視窗的階段進行最小覆寫子串的更新,以便從可行解中找到長度最短的最終結果。

至此,應該可以完全了解這套架構了,滑動視窗算法又不難,就是細節問題讓人煩得很。以後遇到滑動視窗算法,你就按照這架構寫代碼,保準沒有 bug,還省事兒。

下面就直接利用這套架構秒殺幾道題吧,你基本上一眼就能看出思路了。

二、字元串排列

LeetCode 567 題,Permutation in String,難度 Medium:

我寫了一套架構,把滑動視窗算法變成了默寫題

注意哦,輸入的 

s1

 是可以包含重複字元的,是以這個題難度不小。

這種題目,是明顯的滑動視窗算法,相當給你一個 

S

 和一個 

T

,請問你 

S

 中是否存在一個子串,包含 

T

 中所有字元且不包含其他字元?

首先,先複制粘貼之前的算法架構代碼,然後明确剛才提出的 4 個問題,即可寫出這道題的答案:

// 判斷 s 中是否存在 t 的排列
bool checkInclusion(string t, string s) {
    unordered_map<char, int> need, window;
    for (char c : t) need[c]++;

    int left = 0, right = 0;
    int valid = 0;
    while (right < s.size()) {
        char c = s[right];
        right++;
        // 進行視窗内資料的一系列更新
        if (need.count(c)) {
            window[c]++;
            if (window[c] == need[c])
                valid++;
        }

        // 判斷左側視窗是否要收縮
        while (right - left >= t.size()) {
            // 在這裡判斷是否找到了合法的子串
            if (valid == need.size())
                return true;
            char d = s[left];
            left++;
            // 進行視窗内資料的一系列更新
            if (need.count(d)) {
                if (window[d] == need[d])
                    valid--;
                window[d]--;
            }
        }
    }
    // 未找到符合條件的子串
    return false;
}      

對于這道題的解法代碼,基本上和最小覆寫子串一模一樣,隻需要改變兩個地方:

1、本題移動 

left

 縮小視窗的時機是視窗大小大于 

t.size()

 時,應為排列嘛,顯然長度應該是一樣的。

2、當發現 

valid == need.size()

 時,就說明視窗中就是一個合法的排列,是以立即傳回 

true

至于如何處理視窗的擴大和縮小,和最小覆寫子串完全相同。

三、找所有字母異位詞

這是 LeetCode 第 438 題,Find All Anagrams in a String,難度 Medium:

我寫了一套架構,把滑動視窗算法變成了默寫題

呵呵,這個所謂的字母異位詞,不就是排列嗎,搞個高端的說法就能糊弄人了嗎?相當于,輸入一個串 

S

,一個串 

T

,找到 

S

 中所有 

T

 的排列,傳回它們的起始索引。

直接默寫一下架構,明确剛才講的 4 個問題,即可秒殺這道題:

vector<int> findAnagrams(string s, string t) {
    unordered_map<char, int> need, window;
    for (char c : t) need[c]++;

    int left = 0, right = 0;
    int valid = 0;
    vector<int> res; // 記錄結果
    while (right < s.size()) {
        char c = s[right];
        right++;
        // 進行視窗内資料的一系列更新
        if (need.count(c)) {
            window[c]++;
            if (window[c] == need[c]) 
                valid++;
        }
        // 判斷左側視窗是否要收縮
        while (right - left >= t.size()) {
            // 當視窗符合條件時,把起始索引加入 res
            if (valid == need.size())
                res.push_back(left);
            char d = s[left];
            left++;
            // 進行視窗内資料的一系列更新
            if (need.count(d)) {
                if (window[d] == need[d])
                    valid--;
                window[d]--;
            }
        }
    }
    return res;
}      

跟尋找字元串的排列一樣,隻是找到一個合法異位詞(排列)之後将起始索引加入 

res

 即可。

四、最長無重複子串

這是 LeetCode 第 3 題,Longest Substring Without Repeating Characters,難度 Medium:

我寫了一套架構,把滑動視窗算法變成了默寫題

這個題終于有了點新意,不是一套架構就出答案,不過反而更簡單了,稍微改一改架構就行了:

int lengthOfLongestSubstring(string s) {
    unordered_map<char, int> window;

    int left = 0, right = 0;
    int res = 0; // 記錄結果
    while (right < s.size()) {
        char c = s[right];
        right++;
        // 進行視窗内資料的一系列更新
        window[c]++;
        // 判斷左側視窗是否要收縮
        while (window[c] > 1) {
            char d = s[left];
            left++;
            // 進行視窗内資料的一系列更新
            window[d]--;
        }
        // 在這裡更新答案
        res = max(res, right - left);
    }
    return res;
}      

~

這就是變簡單了,連 

need

valid

 都不需要,而且更新視窗内資料也隻需要簡單的更新計數器 

window

window[c]

 值大于 1 時,說明視窗中存在重複字元,不符合條件,就該移動 

left

 縮小視窗了嘛。

唯一需要注意的是,在哪裡更新結果 

res

 呢?我們要的是最長無重複子串,哪一個階段可以保證視窗中的字元串是沒有重複的呢?

五、最後總結

繼續閱讀