天天看点

串的模式匹配算法——BF算法及其复杂度

S串为主串,T为待匹配串,用i、j分别指示S和T中的字符位置,i、j初值均为0。

算法步骤:(1)若当前比较的字符是s【i】==T【j】,则继续向后比较,执行(i++,j++);

(2)若当前正在比较的字符不匹配呢?那么j回溯到位置0(即令j=0),i呢?回溯到主串的i-j+1处

0 1 2 3 4 5 6 7

a b a b c a b d i=2

a b d j=2

a b d j=2;i=7(匹配完成) j=3;i=8

(3)如何判定什么时候能继续比较,什么时候匹配完成呢?

显然,匹配操作要求S串和T串都没到串尾,用语句(i

#include "stdafx.h"

#include<iostream>

#include<string>

using namespace std;

int BF_match(string &s1, string &s2)   //"BF算法"

{

    int i = 0, j = 0;

    int N1 = s1.size(), N2 = s2.size();

    while (i <N1&&j < N2)

    {

        if (s1[i] == s2[j])

        {

            i++;

            j++;

        }

        else

        {

            i = i - j + 1;

            j = 0;

        }

    }

    if (j >= N2) return (i-N2+1);

    return 0;

}

void main()

{

    string s1, s2;

    cin >> s1;

    cin >> s2;

    int p;

    p = BF_match(s1, s2);

    cout << p;

    system("pause");

}

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    17

    18

    19

    20

    21

    22

    23

    24

    25

    26

    27

    28

    29

    30

    31

    32

    33

    34

设S长n,T长m

最好时间复杂度:

最好情况下,在主串第i个位置匹配成功,最好情况下前i-1次每次第一次匹配就失配,前i-1趟比较i-1次,总共进行i-1+m次比较,i可以是从位置1到n-m+1的任何位置:

1/(n-m+1)∑i-1+m=1/2(n+m)

最坏时间复杂度:

最坏情况下,前i-1次每次比较m次才确定失配,前i-1次共比较(i-1)*m,总共比较(i-1)*m+m次,

1/(n-m+1)∑i*m=1/2m*(n-m+2)

用BF算法,每次匹配不成功,主串都要回到i-j+1位置处重新比较,可显然这个回溯操作可以跳过,S与T失配前的i-j——i位与T的前j-1位相同,那么通过T自己匹配自己,我们能否知道S和T匹配过程中可以跳几位呢?

---------------------

作者:weixin_41338006

来源:CSDN

原文:https://blog.csdn.net/weixin_41338006/article/details/78930547

版权声明:本文为博主原创文章,转载请附上博文链接!