KMP----next數組最長相同前字尾遞歸求法解釋

2023-05-09 23:43:08

了解遞歸（推）求解next數組的代碼是個難點，對于剛入門來說

next數組求解的時候是已知next[0....j]，next[j]=k.求解next[j+1]

首先next[j]=k的含義是說前j-1個字元最長相同前字尾是k，也說明字首的最後一個字元下标是k-1

如果p[j]==p[k],那很明顯是next[j+1]=k+1;

p[j]!=p[k]時，這時候

關鍵記住一句話：模式串的自我比對

想一想KMP是怎麼減少重複比較的，不就是移動的時候跳過一些元素嗎，根據什麼跳的，根據next數組跳的，為什麼？因為模式串和文本串在失配前的字元是相等的！如果已經比對相等的字元串裡面有相同前字尾，那我不就可以拿字首的最後一個字元的後一個字元和失配字元直接比較嗎？

比如ADAC和ABAD

在C、D比較時候，失配了，是不是把ABAD往前移動 j-next[j] 等價于

也就是把 p[next[j]]（在這裡是p[1]也就是D）和目前字元D比較

那麼模式串 ADACADADFGH 在計算 ADACADAD 最長相同前字尾是多少

當發現C、D失配

此時就相當于 ADAC和ADAD作比對

也就是如下過程

C位置的next是1（ADA），也就是拿ADAC中的D來和 ADAD作比對

此時p[next[k]==p[j] 然後next=k+1=1+1=2

k=next[k]相當于KMP算法中的j-next[j]，一個是“顯式”移動，一個是直接改變p[k]中的下标，本質相同

代碼如下

void GetNext(char* p,int next[])
{
    int pLen = strlen(p);
    next[0] = -1;
    int k = next[0];
    int j = 0;
    while (j < pLen - 1)
    {
        //p[k]表示字首，p[j]表示字尾
        if (k == -1 || p[j] == p[k]) 
        {
            //++k;
            //++j;
            //next[j] = k;
            next[j+1] = k+1;
            k++;j++;
        }
        else 
        {
            k = next[k];
        }
    }
}

說白了，你不和我相配，我再遞歸找你前面有沒有相同字首字尾，一直找到next[0]=-1為止，此時next[j]=k+1=-1+1=0

KMP----next數組最長相同前字尾遞歸求法解釋

繼續閱讀

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

【資料結構】醫院選址

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

[轉]ISUP信令的IAM消息詳細内容

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

交通/城市相關的公開的資料集上學時整理的Xie et al., 2020收集的

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

Linux裝置模型（中）之上層容器

hdu7108哈希

KMP----next數組 最長相同前字尾 遞歸求法解釋

繼續閱讀

KMP----next數組最長相同前字尾遞歸求法解釋