天天看点

Codeforces Round #166 (Div. 2) D - Good Substrings

题意说的很清楚了,就是要寻找满足某一条件的不同字串个数。

方法一:

寻找不同字串个数体型很直接的一种方法就是把字符串hash值保存在set或者数组中,统计其中不同的个数。

//一个长为n的字符串的字串个数为n*(n+1)/2
#include<cstdio>
#include<cstring>
#include<vector>
#include<algorithm>
#include<set>
#define multiple 1000000007   //这里multiple如果选的太小(31,37,41)效果不如大点(131,1000000003,1000000007)好
using namespace std;
int main(){
    int i,j;
    int n,k;
    char str[2000],str1[50];
    int sum[2000];
    memset(sum,0,sizeof(sum));
    scanf("%s",str);
    scanf("%s",str1);
    scanf("%d",&k);
    for(i=1;i<=strlen(str);i++){
        sum[i]=sum[i-1]+(str1[str[i-1]-'a']=='0');
    }
    long long h[1500*1500];
    int pos=0;
    for(i=1;i<=strlen(str);i++){
        long long tem=0;
        for(j=i;j<=strlen(str);j++){
            if(sum[j]-sum[i-1]>k)break;
            tem=tem*multiple+str[j-1];
            h[pos++]=tem;
        }
    }
    sort(h,h+pos);
    printf("%d\n",unique(h,h+pos)-h);
}
           

方法二:

如果直接用set存放所有的hash值,再统计大小则会超时,解决办法是,只把长度不同的字符串的hash值放到不同的set中统计则会快很多。

//一个长为n的字符串的字串个数为n*(n+1)/2
//strlen卡了我十倍的时间,一定要预处理
#include<cstdio>
#include<cstring>
#include<vector>
#include<algorithm>
#include<set>
#define multiple 1000000007   //这里multiple如果选的太小(31,37,41)效果不如大点(131,1000000003,1000000007)好
typedef long long ll;
using namespace std;
int main(){
    int i,j;
    int n,k;
    char str[2000],str1[50];
    int sum[2000];
    memset(sum,0,sizeof(sum));
    scanf("%s",str);
    scanf("%s",str1);
    scanf("%d",&k);
    n=strlen(str);
    for(i=1;i<=n;i++){
        sum[i]=sum[i-1]+(str1[str[i-1]-'a']=='0');
    }
    int ans=0;
    //ll s[2000];
    //int pos=0;
    set<ll>s;
    ll head=0,tem=0,last=1;
    for(i=1;i<=n;i++){
        s.clear();
        //pos=0;
        head=head*multiple+str[i-1];
        if(sum[i]-sum[0]<=k){
            s.insert(head);
            //s[pos++]=head;
        }
        tem=head;
        for(j=2;j+i-1<=n;j++){
            tem=(tem-str[j-2]*last)*multiple+str[j+i-2];
            if(sum[i+j-1]-sum[j-1]>k)continue;
            s.insert(tem);
            //s[pos++]=tem;
        }
        //sort(s,s+pos);
        //ans+=unique(s,s+pos)-s;
        ans+=s.size();
        last*=multiple;
    }
    printf("%d\n",ans);
}
           

方法三:用trie图统计字串

#include<cstdio>
#include<cstring>
#include<queue>
#define MAXN 2000
#define ALP 26
typedef long long ll;
using namespace std;
int n,k;
char s[2000];
int next[MAXN*MAXN][ALP],pos;
int sum[2000];
int ans;
int newnode(){
    for(int i=0;i<ALP;i++)next[pos][i]=0;
    return pos++;
}
void insert(char *s,int start){
    int p=0;
    for(int i=0;s[i];i++){
        if(sum[start+i+1]-sum[start]>k)break;
        int k=s[i]-'a',&x=next[p][k];
        if(x==0){
            x=newnode();
            p=x;
            ans++;
        }
        else
            p=x;
    }
}
int main(){
    int i,j;
    char str[50];
    pos=0,newnode();
    memset(sum,0,sizeof(sum));
    scanf("%s",s);
    scanf("%s",str);
    scanf("%d",&k);
    n=strlen(s);
    for(i=1;i<=n;i++){
        sum[i]=sum[i-1]+(str[s[i-1]-'a']=='0');
    }
    ans=0;
    for(int i=0;i<n;i++){
        insert(s+i,i);
    }
    printf("%d\n",ans);
    return 0;
}
           

方法四:用后缀数组统计子串

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
#define MAXN 2010
char r[MAXN];
int sa[MAXN];
int wa[MAXN],wb[MAXN],wv[MAXN],ws[MAXN];
int height[MAXN],rank[MAXN];
int sum[2000],k;
inline bool cmp(int *r,int a,int b,int len){
    return r[a]==r[b]&&r[a+len]==r[b+len];
}
void SA(int n,int m){
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++)
        ws[i]=0;
    for(i=0;i<n;i++)
        ws[x[i]=r[i]]++;
    for(i=1;i<m;i++)
        ws[i]+=ws[i-1];
    for(i=n-1;i>=0;i--)
        sa[--ws[x[i]]]=i;
    for(j=p=1;p<n;j<<=1,m=p){
        for(p=0,i=n-j;i<n;i++)
            y[p++]=i;
        for(i=0;i<n;i++){
            if(sa[i]>=j)
                y[p++]=sa[i]-j;
        }
        for(i=0;i<m;i++)
            ws[i]=0;
        for(i=0;i<n;i++)
            ws[wv[i]=x[y[i]]]++;
        for(i=1;i<m;i++)
            ws[i]+=ws[i-1];
        for(i=n-1;i>=0;i--)
            sa[--ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}
void Height(int n){
    int i,j,k=0;
    for(i=1;i<=n;i++)
        rank[sa[i]]=i;
    for(i=0;i<n;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}
void solve(int n){
    int i,j;
    int ans=0;
    for(i=1;i<=n;i++){
        for(j=sa[i]+height[i];j<n;j++){
            if(sum[j+1]-sum[sa[i]]>k)break;
            ans++;
        }
    }
    printf("%d\n",ans);
}
int main(){
    int i,j,n;
    char str[50];
    memset(sum,0,sizeof(sum));
    scanf("%s",r);
    scanf("%s",str);
    scanf("%d",&k);
    n=strlen(r);
    for(i=1;i<=n;i++){
        sum[i]=sum[i-1]+(str[r[i-1]-'a']=='0');
    }
    memset(height,0,sizeof(height));
    SA(n+1,130);
    Height(n);
    solve(n);
}