快速幂
幂運算是非常常見的一種運算,求取an,最容易想到的方法便是通過循環逐個累乘,其複雜度為O(n),這在很多時候是不夠快的,是以我們需要一種算法來優化幂運算的過程。
快速幂——反複平方法
該怎樣去加速幂運算的過程呢?既然我們覺得将幂運算分為n步進行太慢,那我們就要想辦法減少步驟,把其中的某一部分合成一步來進行。
比如,如果n能被2整除,那我們可以先計算一半,得到an/2的值,再把這個值平方得出結果。這樣做雖然有優化,但優化的程度很小,仍是線性的複雜度。
再比如,如果我們能找到2k=n,那我們就能把原來的運算優化成((a2)2)2…,隻需要k次運算就可以完成,效率大大提升。可惜的是,這種條件顯然太苛刻了,适用範圍很小。不過這給了我們一種思路,雖然我們很難找到2k=n,但我們能夠找到2k1+2k2+2k3+…+2km=n。這樣,我們可以通過遞推,在很短的時間内求出各個項的值。
我們都學習過進制與進制的轉換,知道一個b進制數的值可以表示為各個數位的值與權值之積的總和。比如,2進制數1001,它的值可以表示為10進制的1×23+0×22+0×21+1×20,即9。這完美地符合了上面的要求。可以通過2進制來把n轉化成2km的序列之和,而2進制中第i位(從右邊開始計數,值為1或是0)則标記了對應的2i−1是否存在于序列之中。譬如,13為二進制的1101,他可以表示為23+22+20,其中由于第二位為0,21項被舍去。
如此一來,我們隻需要計算a、a2、a4、a8…a2km的值(這個序列中的項不一定都存在,由n的二進制決定)并把它們乘起來即可完成整個幂運算。借助位運算的操作,可以很友善地實作這一算法,其複雜度為O(logn)。
typedef long long ll;
ll mod;
ll qpow(ll a, ll n)//計算a^n % mod
{
ll re = 1;
while(n)
{
if(n & 1)//判斷n的最後一位是否為1
re = (re * a) % mod;
n >>= 1;//舍去n的最後一位
a = (a * a) % mod;//将a平方
}
return re % mod;
}
取模運算一般情況下是需要的,當然也可以省去。
矩陣快速幂
需要進行幂運算的不僅僅隻有整數,比如,在POJ3070 Fibonacci中,就需要我們快速地完成方陣的幂運算。知道了如何做快速幂,我們還可以将同樣的思想運用在其他地方。除了乘法的規則與普通快速幂不同之外不同,其他的細節并沒有什麼差别。
實作矩陣快速幂的一種方法如下:
struct matrix//定義一個結構體,友善傳遞值
{
int m[maxn][maxn];
};
/*
maxn和mod由全局定義,其中mod根據需要可以省去
*/
matrix mat_multi(matrix a, matrix b)//矩陣求積
{
matrix ans;
for(int i = 0;i < maxn;i++)
{
for(int j = 0;j < maxn;j++)
{
ans.m[i][j] = 0;
for(int k = 0;k < maxn;k++)
{
ans.m[i][j] += (a.m[i][k] % mod * b.m[k][j] % mod) % mod;
ans.m[i][j] %= mod;
}
}
}
return ans;
}
matrix mat_quickpow(matrix a, int n)//矩陣快速幂
{
matrix ans;
for(int i = 0;i < maxn;i++)
{
for(int j = 0;j < maxn;j++)
{
if(i == j)
ans.m[i][j] = 1;
else
ans.m[i][j] = 0;//這裡要初始化為機關矩陣,類比普通快速幂這裡初始化為1
}
}
while(n != 0)//方法與普通快速幂相同,隻有乘法的實作不同
{
if(n & 1)
ans = mat_multi(a, ans);
a = mat_multi(a, a);
n >>= 1;
}
return ans;
}