天天看点

OI/ACM最全卡常大招

NO.10: 循环展开:

      在缓存和寄存器允许的情况下一条语句内大量的展开运算会刺激 CPU 并发(蛤?这是个什么原理,算了,反正写了没坏处就这么写吧)

NO.9: 特殊运算优化:(或许这真的没用)

 取模优化:

inline int inc(int x,int v,int mod){x+=v;return x>=mod?x-mod:x;}//代替取模+
inline int dec(int x,int v,int mod){x-=v;return x<0?x+mod:x;}//代替取模-      

  绝对值优化:

inline int Abs(int a){//绝对值优化
{
    int b=a>>31;
    return (a+b)^b;
}      

NO.8: 前置++/--运算符:(有利无弊)

NO.7: if()else语句比()?():()语句慢(但慢的不多,在判断较少的时候还是用if吧)。

          网上很多说if比?:慢,但是其实不是这样的。二者的汇编除了文件名不一样其他都一模一样。其实不是?:比if快而是?:比if-else快。

NO.6: 内联:

           函数内联:比如说:

inline add(int u,int v)
{
    star[++cnt].to=v;
    star[cnt].nxt=head[u];
    head[u]=cnt;
}      

            但要拒绝inline大递归函数,用的少的函数比如只用1次的就不要inline了,那样反而更慢;

        另类内联:

struct haha{
    int v,x;
    inline bool operator < (haha tar){//强制内联
        return v<tar.v;
    }
}lala[MAXN+1];      

NO.5:使用局部变量的效率比使用静态变量要高。

         因为局部变量是存在于堆栈中的,对其空间的分配仅仅是修改一次\(esp\)寄存器的内容即可.而局部变量存在于堆栈中最大的好处是,函数能重复使用内存,当一个函数调用完毕时,退出程序堆栈,内存空间被回收,当新的函数被调用时,局部变量又可以重新使用相同的地址。当一块数据被反复读写,其数据会留在\(CPU\)的一级缓存(\(Cache\))中,访问速度非常快。而静态变量却不存在于堆栈中。

NO.4:优化STL

       大部分的STL较慢的原因是在动态内存分配时对push_back()的函数大大的不友好;

       我们可以手写足够大小的内存池来代替动态分配内存。

#include<bits/stdc++.h>
using namespace std;
#define reg register
static char space[10000000],*sp=space;
template<typename T>
struct myalloc:allocator<T>{
    myalloc(){}
    template<typename T2>
    myalloc(const myalloc<T2> &a){}
    template<typename T2>
    myalloc<T>& operator=(const myalloc<T2> &a){return *this;}
    template<typename T2>
    struct rebind{typedef myalloc<T2> other;};
    inline T* allocate(size_t n){
        T *result=(T*)sp;sp+=n*sizeof(T);
        return result;
    }
    inline void deallocate(T* p,size_t n){}
};      
list<int,myalloc<int> > L;vector<double,myalloc<double> > vec //容量的定义      

但当内存过大时,不要套用此代码,因为该代码为了简短并没有释放内存;

NO.3: I/O优化

    scanf比cin快得多,printf比cout快得多,如果你不知道就……就现在知道了

    普通版:(适用于正负int范围内的数)

void read(int &x) 
{
     int f=1;x=0;char s=getchar(); 
     while(s<'0'||s>'9'){if(s=='-')f=-1;s=getchar();} 
     while(s>='0'&&s<='9'){x=x*10+s-'0';s=getchar();}
     x*=f; 
}      

    提升版:(快是快,但在考试中的性价比并不高)

inline char get_char(){//超级快读
    static char buf[1000001],*p1=buf,*p2=buf;
    return p1==p2&&(p2=(p1=buf)+fread(buf,1,1000000,stdin),p1==p2)?EOF:*p1++;
}
inline int read(){
    int num=0;
    char c;
    while(isspace(c=get_char()));
    while(num=num*10+c-48,isdigit(c=get_char()));
    return num;
}      

NO.2: register

    在定义一个变量时加一个register,其意义是将该变量放入寄存器中进行运算(如果可以的话),

    它的效果在该变量不断重复使用时间的优化极大,往往用时是不优化的40%;

NO.1: #pragma GCC optimize(2)(请勿在NOIP中作死)

   这便是O2优化

    它的作用极大,但如果代码不规范,它在优化时会改变某句代码的含义,所以在用时一定要小心从30%TLE变为100%WA;

    实践证明开了O2的莫队快的飞起,模拟退火烧到了你上辈子的屁股;

继续阅读