全卷積網絡中預測部分的softmax操作原理簡析

2023-05-02 14:43:50

概要

現在目标檢測網絡有采用全卷積結構進行預測的趨勢，采用該結構能夠1）大幅降低參數數量（全連接配接參數數量巨大），2）适配任意尺度輸入，3）精度上也沒有顯著降低等優點。這兩天在研究SSH: Single Stage Headless Face Detector, 分析了預測子產品中的結構，為什麼要将(n,c,w,h)reshape成(n,2,c/2w,h)這一細節，話不多說，進入正題。

簡析

全卷積網絡中預測部分的softmax操作原理簡析

以ssh模型架構M1結構為例，檢測部分進行了如上圖所示的流程。現簡要分析如下：

假設全卷積網絡特征圖尺寸是(1,256,3,4)即n,c,h,w.

想在每個cell 兩個anchor，總數為3x4=12的尺度上做人臉檢測，輸出特征圖如下所示：

全卷積網絡中預測部分的softmax操作原理簡析

用下面這種方式更清楚：

全卷積網絡中預測部分的softmax操作原理簡析

ssh_cls_score卷積輸出後feat是(1,4,3,4) 4是2個anchor,按照以下順序

排序排列資料：兩個anchor為負樣本（label=0）,兩個anchor為人臉

的分值，例如第一個cell的anchor資料位置如下：

全卷積網絡中預測部分的softmax操作原理簡析

計算softmax是要用數位1和25, 13和37進行，出來的softmax 值sum=1，reshape 之後變成了(1, 2, 6, 4), 然後将softmax axis=1就可以進行以上操作, caffe中預設的axis是1，pytorch中也有相應的次元設計。reshape之後如下：

全卷積網絡中預測部分的softmax操作原理簡析

計算softmax之後再reshape回來，後面就可以按照分支進行propsal操作了。

其他

loc偏移由于不用做softmax操作，是以可以直接輸出。

全卷積網絡中預測部分的softmax操作原理簡析

概要

簡析

其他

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡