Going deeper with convolutions

motivations:

提高模型性能的最直接方式：1.加深（增加層）2.加寬（增加單層的神經元個數）,帶來的兩個弊端：1.大規模的參數易導緻過拟合且需要更多的訓練集 2.更多的計算資源消耗
解決基本思想是在fc層甚至conv層使用稀疏連接配接結構，原因是

1.生物中神經網絡是稀疏的.

2Arora的實驗說明了，優化大規模的稀疏神經網絡時，可以通過分析激活值的統計特性和聚類相關性高的神經元來逐層建構一個最優網絡。（block設計的來源）。

3.Hebbian 原理：neurons that fire together，wire together（說明神經元相關性）

早期稀疏結構實作缺點，軟硬體對非均勻的稀疏資料計算效率差，反倒是對密集矩陣（dense matrix）效率較高。

稀疏模型将大量的備援變量去除，隻保留與響應變量最相關的解釋變量，簡化了模型的同時卻保留了資料集中最重要的資訊，有效地解決了高維資料集模組化中的諸多問題。稀疏模型具有更好的解釋性，便于資料可視化、減少計算量和傳輸存儲。1996年Tibshirani把嶺回歸估計的L2範數罰正則化項替換為L1範數罰正則化項得到了Lasso(Least Absolute Shrinkage and Selection Operator, Lasso)。L1範數罰具有産生稀疏模型的能力，使用L1範數罰作為正則化項的Lasso具有變量選擇功能和變量空間降維功能。實際上在Lasso之前已有能夠産生稀疏解的非負絞刑估計 (nonnegative garrote estimator)和橋回歸(bridge regression)模型被提出，但由于缺少高效的求解算法因而沒有引起足夠的重視，而自從Lasso這種稀疏模型以及可對其有效求解的LAR算法(Least Angle Regression, LAR)被提出後，稀疏模型才得到了廣泛深入的研究，并在機器學習、數理統計和生物資訊學等領域逐漸流行起來。

思考：有沒有一種方法，既能保持網絡結構的稀疏性，又能利用密集矩陣（卷積）的高計算性能。而相關文獻表明可以将稀疏矩陣聚類為較為密集的子矩陣來提高計算性能

Inception最初原形：

第一作者Christian Szegedy，評估一個複雜的網絡拓撲結構建構算法的假設輸出，該網絡試圖逼近Arora提出的稀疏結構。

最初結構隻是猜想，然而通過兩輪的疊代後，獲得了不錯的結果。(實驗證明有效)

naive inception module：

inception v1motivations:Inception最初原形：
說明：1.1x1conv，用于對相關性高的神經元聚類 2.為了避免patch alignment問題，增加3X3，5X5（大感受野的聚類，這麼設計更多的考慮是友善還不是必要性）3.Pool是cnn中有效的操作，是以也加入
Naïve的問題，通道堆到後面會越來越多，借鑒NIN，1x1降維

作者說明，對一個壓縮且密集的特征資訊進行模組化是很難的，是以隻在必要時才壓縮信号
inception v1motivations:Inception最初原形：
考慮到目前計算條件，Inception置于較深層，淺層采用傳統卷積
網絡結構：

inception v1motivations:Inception最初原形：

1.Block設計。2.Gap代替全連接配接。3.添加dropout（0.7）。4.輔助損失.（權重0.3，在inception 4a和4d的輸出接,作用a增強底層特征差異性b增強梯度信号c提高正則化）
輔助loss：4a和4d
inception v1motivations:Inception最初原形：

inception v1motivations:Inception最初原形：
實驗結果
inception v1motivations:Inception最初原形：

标簽: inception, CNN

inception v1motivations:Inception最初原形：

Going deeper with convolutions

motivations:

Inception最初原形：

網絡結構：

inception v1motivations:Inception最初原形：

實驗結果

繼續閱讀

大聯大控股宣布，其旗下世平推出基于耐能（Kneron）KL630系列晶片的AI相機方案。圖示1-大聯大世平基于耐能K

#看最幼稚的動畫明白最深的道理#我又來送圖啦#畫風突變#pico探索無限可能#transformer神經網絡架構

多活資料中心分布式雲網絡架構設計與實踐

如何在大流量場景下雲淡風輕地進行線上釋出？

據悉最近《未來技術趨勢研究報告》的撰寫完成了，意味着6G的發展進入了新時代。而在手機廠商中，OPPO在新技術探索上是蠻積

#交換機可以代替路由器嗎?#雖然交換機和路由器在網絡中都起着重要的作用，但它們具有不同的功能和用途，是以不能完全互相替代

為AI大模型打破算力瓶頸，騰訊雲的第三次網絡架構進化

5G無線網絡關于實體層關鍵技術探析5G無線網絡是一種蜂窩結構，一般無線使用者大多數時間在室内使用，而室外的利用時間一般僅僅

現在的中小企業網絡架構基本上都比較穩定了。一般都是外網防火牆，中間串接一個深信服ac做管控，下面就是核心交換機，核心交換

随着自動化複雜性的增加和已處理資訊量的增加，人們需要對人機界面和互動（HMI2）進行進一步的研究，以實作更好的人機協作，

辦公室布線：合理設計規劃網絡架構

軟體定義廣域網——數字化工廠未來網絡架構

今天的活動廣場一下子不見了，看了友友們的文章才知道最近這種情況很多，我這也是通過一個友友的話題進入活動，大家可以參考這個

資料标注員是人工智能訓練師。尚躍智能科技創始人兼董事長是尚立卓。很多人對資料标注的了解僅限于拉框，今天我想分享一下真正意

#精益智能——學習智能工廠建設方案#2、完全整合精益生産概念充分展現産業工程和精益生産的概念，真正達到訂單驅動、拉動式生

一步登天！未來自動駕駛汽車的超強網絡架構将如何實作無縫通信？

inception v1motivations:Inception最初原形：

Going deeper with convolutions

motivations:

Inception最初原形：

網絡結構： inception v1motivations:Inception最初原形：

實驗結果

繼續閱讀

網絡結構：

inception v1motivations:Inception最初原形：