素数的筛法有很多种
在此给出常见的三种方法
以下给出的所有代码均已通过这里的测试
埃拉托斯特尼筛法
名字好长 :joy: 不过代码很短
思路非常简单,对于每一个素数,枚举它的倍数,它的倍数一定不是素数
这样一定可以保证每个素数都会被筛出来
还有,我们第一层循环枚举到$\sqrt(n)$就好,因为如果当前枚举的数大于n,那么它能筛出来的数一定在之前就被枚举过
比如说:
$\sqrt(100)=10$
不难发现我们从$20$枚举所筛去的数一定被$5$筛过
1 #include<cstdio>
2 #include<cmath>
3 using namespace std;
4 const int MAXN=10000001;
5 inline int read()
6 {
7 char c=getchar();int f=1,x=0;
8 while(c<'0'||c>'9') {if(c=='-') f=-1;c=getchar();}
9 while(c>='0'&&c<='9') x=x*10+c-48,c=getchar();return x*f;
10 }
11 int vis[MAXN];
12 int n,m;
13 int main()
14 {
15 n=read();m=read();
16 vis[1]=1;//1不是质数
17 for(int i=2;i<=sqrt(n);i++)
18 for(int j=i*i;j<=n;j+=i)
19 vis[j]=1;
20 while(m--)
21 {
22 int p=read();
23 if(vis[p]==1) printf("No\n");
24 else printf("Yes\n");
25 }
26 return 0;
27 }
但是你会发现这份代码只能得30分

看来这种算法还是不够优秀
下面我们来探索一下他的优化
另外,这种算法的时间复杂度:$O(n*logn)$
埃拉托斯特尼筛法优化版
根据唯一分解定理
每一个数都可以被分解成素数乘积的形式
那我们枚举的时候,只有在当前数是素数的情况下,才继续枚举就好
这样可以保证每个素数都会被筛出来
1 #include<cstdio>
2 #include<cmath>
3 using namespace std;
4 const int MAXN=10000001;
5 inline int read()
6 {
7 char c=getchar();int f=1,x=0;
8 while(c<'0'||c>'9') {if(c=='-') f=-1;c=getchar();}
9 while(c>='0'&&c<='9') x=x*10+c-48,c=getchar();return x*f;
10 }
11 int vis[MAXN];
12 int n,m;
13 int main()
14 {
15 n=read();m=read();
16 vis[1]=1;//1不是质数
17 for(int i=2;i<=sqrt(n);i++)
18 if(vis[i]==0)
19 for(int j=i*i;j<=n;j+=i)
20 vis[j]=1;
21 while(m--)
22 {
23 int p=read();
24 if(vis[p]==1) printf("No\n");
25 else printf("Yes\n");
26 }
27 return 0;
28 }
果然,加了优化之后这种算法快了不少
可以证明,它的复杂度为:$O(n*log^{logn})$
这种算法已经非常优秀了,但是对于1e7这种极端数据,还是有被卡的风险
那么,还有没有更快的筛法呢?
答案是肯定的!
欧拉筛
我们思考一下第二种筛法的运算过程
不难发现,对于6这个数,它被2筛了一次,又被3筛了一次
第二次筛显然是多余的,
我们考虑去掉这步运算
1 #include<cstdio>
2 #include<cmath>
3 using namespace std;
4 const int MAXN=10000001;
5 inline int read()
6 {
7 char c=getchar();int f=1,x=0;
8 while(c<'0'||c>'9') {if(c=='-') f=-1;c=getchar();}
9 while(c>='0'&&c<='9') x=x*10+c-48,c=getchar();return x*f;
10 }
11 int vis[MAXN],prime[MAXN];
12 int tot=0;
13 int n,m;
14 int Euler()
15 {
16 vis[1]=1;
17 for(int i=2;i<=n;i++)
18 {
19 if(vis[i]==0) prime[++tot]=i;
20 for(int j=1;j<=tot&&i*prime[j]<=n;j++)
21 {
22 vis[i*prime[j]]=1;
23 if(i%prime[j]==0) break;
24 }
25 }
26 }
27 int main()
28 {
29 n=read();m=read();
30 Euler();
31 for(int i=1;i<=m;i++)
32 {
33 int p=read();
34 if(vis[p]==1) printf("No\n");
35 else printf("Yes\n");
36 }
37 return 0;
38 }
对于这份代码,我们分情况讨论
当$i$是素数的时候,那么两个素数的乘积一定没有被筛过,可以避免重复筛
当$i$不是素数的时候
程序中有一句非常关键的话
if(i%prime[j]==0) break;
如果我们把$i$的唯一分解形式表示为$i = p_1^{a_1}p_2^{a_2} \dots p_n^{a_n}$
这句话可以保证:本次循环只能筛除不大于${p_1}*i$的数
这样的话每个数$i$都只能筛除不大于$i$乘$i$的最小素因子的数
反过来,每个数只能被它的最小素因子筛去。
也就可以保证每个数只会被筛一次(这一步好像不是很显然,我在最后会给出证明)
举个例子,
设$i=2*3*5$,此时能筛去$i*2$,但是不能筛去$3*i$
因为如果能晒出$3*i$的话,
当$i_2=3*3*5$时,筛除$2*i_2$就和前面重复了
另外为了方便大家直观理解,给出一张图表
这样显得直观一些
大家好好揣摩揣摩
上面的证明:我自己瞎yy的可能不是很严谨
现在我们需要证明$i = p_1^{a_1}p_2^{a_2} \dots p_n^{a_n}$只会被$p_1$筛去
那么我们需要证明三个条件
1.$i$一定被$p_1$和$p_1^{a_1 - 1}p_2^{a_2} \dots p_n^{a_n}$筛除过
很显然,在枚举到$p_1$之前不会有其他素因子使$p_1^{a_1 - 1}p_2^{a_2} \dots p_n^{a_n}$停止循环
2.$i$不会被$p_1^{a_1}p_2^{a_2 - 1} \dots p_n^{a_n}$筛去
同样也很显然,当枚举到$p_1$时就会停止循环
可以看出这种算法的时间效率是非常高的!
时间复杂度:严格$O(n)$
总结
在一般情况下,第二种筛法已经完全够用。
第三种筛法的优势不仅仅在于速度快,而且还能够筛积性函数,像欧拉函数,莫比乌斯函数等。
这个我以后还会讲的
作者:自为风月马前卒
个人博客http://attack204.com//
出处:http://zwfymqz.cnblogs.com/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。