天天看點

用字元串哈希方法解決字元串比對問題

題目和題解如下。

給定一個模式串 S,以及一個模闆串 P,所有字元串中隻包含大小寫英文字母以及阿拉伯數字。

模闆串 P 在模式串 S 中多次作為子串出現。

求出模闆串 P 在模式串 S 中所有出現的位置的起始下标。

輸入格式

第一行輸入整數 N,表示字元串 P 的長度。

第二行輸入字元串 P。

第三行輸入整數 M,表示字元串 S 的長度。

第四行輸入字元串 S。

輸出格式

共一行,輸出所有出現位置的起始下标(下标從 0 開始計數),整數之間用空格隔開。

資料範圍

1≤N≤105

1≤M≤106

輸入樣例:

3

aba

5

ababa

輸出樣例:

0 2
#include <iostream>

typedef unsigned long long ull;
const int N = 1e5 + 10, M = 1e6 + 10, P = 131;
//h1/h2存儲長/短的字元串前i個字元的哈希值,p是P的i次方的值
ull h1[M], h2[N], p[M];
int n, m;
char str[M], substr[N];

ull find(int l, int r)
{
    return h1[r] - h1[l - 1] * p[r - l + 1];
}

int main()
{
    scanf("%d%s%d%s", &n, substr + 1, &m, str + 1);
    p[0] = 1;
    for(int i=1;i<=m;i++)
    {
        p[i] = p[i - 1] * P;
        h1[i] = h1[i - 1] * P + str[i];
        if(i <= n)
        {
            h2[i] = h2[i - 1] * P + substr[i];
        }
    }
    for(int i=1;i+n-1<=m;i++)
    {
        if(find(i, i + n - 1) == h2[n]) printf("%d ", i - 1);
    }
    return 0;
}
           

繼續閱讀