深度神經網絡壓縮論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼

2022-12-19 05:35:00

論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

源碼：github 源碼

介紹：

本篇論文主要講述關于深度學習網絡參數的壓縮工作。論文主要從下三點出發：

pruning：對網絡進行剪枝，隻保留重要的連接配接
train quantization：通過參數共享量化權重矩陣
huffman coding：對量化值進行huffman編碼，進一步壓縮。

整個網絡在不影響性能的情況下，能夠将參數量降低到原來的1/49~1/35。

深度神經網絡壓縮論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼

網絡剪枝

在深度學習訓練的過程中，會學到連接配接的參數。剪枝的方法是：連接配接的權值小于一定門檻值的直接移除，最終就得到了稀疏的網絡連接配接。剪枝這一步驟能夠将VGG-16（AlexNet)參數降低到原來的1/13(1/9)。

稀疏矩陣用compressed sparse row(CSR)和compressed sparse column(CSC)的格式進行壓縮，總共需要2a+n+1個存儲單元，a是非零元素個數，n是行數或者列數。

網絡剪枝的過程如figure 2所示：

深度神經網絡壓縮論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼

一個4*4的矩陣可以用一維16數組表示，剪枝時候，隻保留權值大于指定門檻值的數，用相對距離來表示，例如idx=4和idx=1之間的位置差為3，如果位置差大于設定的span，那麼就在span位置插入0。例如15和4之間距離為11大于span（8），是以在4+8的位置插入0，idx=15相對idx=12為3。這裡span門檻值在卷積層設定為8，全連接配接層為5。

共享量化權重矩陣

深度神經網絡壓縮論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼

上圖假定某層有4個輸入單元4個輸出單元，權重矩陣為4*4，梯度同樣為4*4。

假設權重被量化為4類，用四種顔色辨別。用每類量化的值代表每類的權值，得到量化後的權值矩陣。用4個權值和16個索引就可以計算得到4*4權重矩陣連接配接的權值。梯度矩陣同樣量化為4類，對每類的梯度進行求和得到每類的偏置，和量化中心一起更新得到新的權值。

壓縮率計算方法如下公式所示：

r=nbnlog2k+kb(1)

公式（1）n代表連接配接數，b代表每一個連接配接需要b bits表示，k表示量化k個類，k類隻需要用 log2(k) 個bit表示，n個連接配接需要 nlog2(k) 索引，還需要用 kb 表示量化中心的數值。

霍夫曼編碼

聚類中心，需要用 log2(k) 的bit作為索引，這裡可以使用變長的huffman編碼進一步壓縮。figure 5顯示了壓縮前和壓縮後的長度分布。

深度神經網絡壓縮論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼

深度神經網絡壓縮論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼

論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

源碼：github 源碼

介紹：

網絡剪枝

共享量化權重矩陣

霍夫曼編碼

繼續閱讀

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

解讀2008年網絡技術熱詞之雲計算

《eWEEK》：09年5大科技發展趨勢雲計算居首

《正在爆發的網際網路革命》

淺談使用Fiddler工具進行弱網測試

linux網絡程式設計----發送與接收檔案

深度學習模型分析人類複雜疾病的準确性

PHP進階學習之session寫入資料庫

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

手動安裝Intel network I217-LM網卡的Linux驅動

XX系統實施過程問題總結

nginx 安裝錯誤資訊解決

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

深度神經網絡壓縮 論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼

論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

源碼：github 源碼

介紹：

網絡剪枝

共享量化權重矩陣

霍夫曼編碼

繼續閱讀

深度神經網絡壓縮論文位址：Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding 源碼：github 源碼