【darknet】閱讀了解（5）——batchnorm和activation

2023-06-19 11:02:50

1. batchnorm

1.1 原理

大緻的原理可以參考:https://blog.csdn.net/qq_25737169/article/details/79048516

【darknet】閱讀了解（5）——batchnorm和activation

如果了解個大概的話，就是：（x-均值）/ 偏差 * 縮放系數 + 一個偏置

1.2 darknet實作

說明：

darknet cpu采用C實作的，能更有助于原理的了解
或者也可以用numpy等進階架構實作

總之，darknet的實作和想象中的實作還是有點差別的。關鍵的一句是：對channel之外的所有次元進行平均，是以，一個batch_norm有n個均值，方差，縮放系數，偏移值。n = 卷積核的個數。

1.3 具體實作和注釋

1.batch_norm
void forward_batchnorm_layer(layer l, network net)
{
    if(l.type == BATCHNORM) copy_cpu(l.outputs*l.batch, net.input, 1, l.output, 1);
    copy_cpu(l.outputs*l.batch, l.output, 1, l.x, 1);           // 将l.output copy到l.x
    if(net.train){
        mean_cpu(l.output, l.batch, l.out_c, l.out_h*l.out_w, l.mean);                 // 均值     // 對channel之外的所有次元進行平均，這裡是模仿ANN的batchnorm對每個神經元歸一化，CNN是對把每個卷積核當成了神經元
        variance_cpu(l.output, l.mean, l.batch, l.out_c, l.out_h*l.out_w, l.variance); // 方差     // 可參考https://www.zhihu.com/question/269658514

        scal_cpu(l.out_c, .99, l.rolling_mean, 1);              // 初始化32個rolling_mean，儲存全局的平均值，用于推理時
        axpy_cpu(l.out_c, .01, l.mean, 1, l.rolling_mean, 1);   // 這裡l.mean和l.roling_mean二者的位置是不是反了
        scal_cpu(l.out_c, .99, l.rolling_variance, 1);          // 推理時用到的方差
        axpy_cpu(l.out_c, .01, l.variance, 1, l.rolling_variance, 1);

        normalize_cpu(l.output, l.mean, l.variance, l.batch, l.out_c, l.out_h*l.out_w);   
        copy_cpu(l.outputs*l.batch, l.output, 1, l.x_norm, 1);
    } else {
        normalize_cpu(l.output, l.rolling_mean, l.rolling_variance, l.batch, l.out_c, l.out_h*l.out_w);
    }
    scale_bias(l.output, l.scales, l.batch, l.out_c, l.out_h*l.out_w);      // scale，add,和normalize可以一起做，減少循環
    add_bias(l.output, l.biases, l.batch, l.out_c, l.out_h*l.out_w);        // 偏置
}

2. 求均值
void mean_cpu(float *x, int batch, int filters, int spatial, float *mean)
{
    float scale = 1./(batch * spatial);     
    int i,j,k;
    for(i = 0; i < filters; ++i){           // 卷積核的個數
        mean[i] = 0;
        for(j = 0; j < batch; ++j){
            for(k = 0; k < spatial; ++k){
                int index = j*filters*spatial + i*spatial + k;
                mean[i] += x[index];
            }
        }
        mean[i] *= scale;
    }
}

2. activation

如果用numpy實作的話是一個進階函數的問題 np.maximum(x, 0)
darknet采用了一個for循環+内聯函數實作，内聯函數便于激活函數的同一格式，for循環（難道還有其他實作嗎？）

1. for 循環
void activate_array(float *x, const int n, const ACTIVATION a)
{
    int i;
    for(i = 0; i < n; ++i){
        x[i] = activate(x[i], a);           // 激活函數
    }
}

2. 内聯函數
static inline float leaky_activate(float x){return (x>0) ? x : .1*x;}

【darknet】閱讀了解（5）——batchnorm和activation

1. batchnorm

1.1 原理

1.2 darknet實作

1.3 具體實作和注釋

2. activation

繼續閱讀

blas、lapack、atlas在Ubuntu上的安裝

PyTorch架構學習-PyTorch的安裝（CPU版本）及問題報錯+解決方案一、步驟二、報錯問題及解決方案三、補充常用指令

深度學習之相關硬體知識總結

學習《TensorFlow實戰Google深度學習架構》（八）卷積神經網絡簡介第六章圖像識别與卷積神經網絡

[深度學習架構] Keras上使用RNN進行mnist分類

用Python&Tensorflow打造自己的圖像識别模型

（讀書筆記）各深度學習架構簡要介紹1.Tensorflow2.Caffe3.Theano4.Torch5.Keras6.CNTK7.其他深度學習架構

TensorFlow深度學習架構學習（一）：深度學習概念以及應用

移動端深度學習架構小結

Ubuntu16.04下安裝Caffe(CPU版)第一步：安裝Caffe依賴第二步：安裝Caffe第三步：設定Python Caffe 路徑第四步：遇到的錯誤最後的最後：後續的學習。。。

分布式深度學習架構的前世今生，從 MapReduce 到 Pathways

2023了，學習深度學習架構哪個比較好？

飛槳進入2.0時代，他發生了什麼變換？

[深度學習架構] 在Mac上安裝Tensorflow

★華世智能控制——邊緣計算終端嵌入式二次開發應用:可應用于光伏電站監控系統的裝置監測、工業控制、邊緣計算、人物識别高性能