Focal Loss(RetinaNet) 與 OHEM

Focal Loss for Dense Object Detection-RetinaNet

YOLO和SSD可以算one-stage算法裡的佼佼者，加上R-CNN系列算法，這幾種算法可以說是目标檢測領域非常經典的算法了。這幾種算法在提出之後經過數次改進，都得到了很高的精确度，但是one-stage的算法總是稍遜two-stage算法一籌，于是就有了Focal Loss來找場子。

在Focal Loss這篇論文中中，作者認為one-stage精确度不如two-stage是因為下面的原因：

① 正負樣本比例極度不平衡。由于one-stage detector沒有專門生成候選框的子網絡，無法将候選框的數量減小到一個比較小的數量級（主流方法可以将候選框的數目減小到數千），導緻了絕大多數候選框都是背景類，大大分散了放在非背景類上的精力；

② 梯度被簡單負樣本主導。我們将背景類稱為負樣本。盡管單個負樣本造成的loss很小，但是由于它們的數量極其巨大，對loss的總體貢獻還是占優的，而真正應該主導loss的正樣本由于數量較少，無法真正發揮作用。這樣就導緻收斂不到一個好的結果。

既然負樣本數量衆多，one-stage detector又不能減小負樣本的數量，那麼很自然的，作者就想到減小負樣本所占的權重，使正樣本占據更多的權重，這樣就會使訓練集中在真正有意義的樣本上去，這也就是Focal Loss這個題目的由來。

其實在Focal Loss之前，就有人提出了OHEM(online hard example mining)方法。OHEM的核心思想就是增加錯分類樣本的權重，但是OHEM卻忽略了易分類樣本，而我們知道這一部分是所有樣本中的絕大部分。

與OHEM不同，Focal Loss把注意力放在了易分類樣本上，它的形式如圖所示。Focal Loss是一種可變比例的交叉熵損失，當正确分類可能性提高時比例系數會趨近于0。這樣一來，即使再多的易分類樣本也不會主導梯度下降的過程，于是訓練網絡自然可以自動對易分類樣本降級，進而快速地集中處理難分類樣本。

可以看出，Focal Loss打敗了所有state-of-the-art的算法，而且竟然在速度上也是一馬當先，可以說相當有說服力。但是作者為了證明Focal Loss的有效性，并沒有設計更新穎的網絡，這與其他算法提高精确度的做法是不一樣的——他們要麼改造原有算法的網絡結構，要麼另辟蹊徑。另外，Focal Loss函數的形式并不是不可變的，隻要可以達到對易分類樣本降級的目的，可以在形式上有所變化。

總之，Class imbalance是阻礙one-stage方法提高準确率的主要障礙，過多的easy negative examples會在訓練過程中占據主導地位，使訓練結果惡化，是以要用Focal Loss對easy negative examples進行降級，而把更多的注意力集中在hard examples上。

OHEM: Training Region-based Object Detectors with Online Hard Example Mining

Hard example mining：https://github.com/abhi2610/ohem

主要有2種參見Hard example mining算法，優化SVM時候的算法和非SVM時的利用。

在優化SVM中使用Hard example mining時，訓練算法主要維持訓練SVM和在工作集上收斂的平衡疊代過程，同時在更新過程中去除一些工作集中樣本并添加其他特殊的标準。這裡的标準即去掉一些很容易區分的樣本類，并添加一些用現有的模型不能判斷的樣本類，進行新的訓練。工作集為整個訓練集中的一小部分資料。

非SVM中使用時，該Hard example mining算法開始于正樣本資料集和随機的負樣本資料集，機器學習模型在這些資料集中進行訓練使其達到該資料集上收斂，并将其應用到其他未訓練的負樣本集中，将判斷錯誤的負樣本資料（false positives）加入訓練集，重新對模型進行訓練。這種過程通常隻疊代一次，并不獲得大量的再訓練收斂過程。

網絡結構架構：

OHEM算法基于Fast R-CNN算法進行改進，作者認為Fast R-CNN算法中創造mini-batch用來進行SGD算法，并不具有高效和最優的狀态，而OHEM可以取得lower training loss，和higher mAP。對比下圖兩種算法Fast R-CNN和OHEM結構：

對比可以發現，文章提出的OHEM算法裡，對于給定圖像，經過selective search RoIs，同樣計算出卷積特征圖。但是在綠色部分的（a）中，一個隻讀的RoI網絡對特征圖和所有RoI進行前向傳播，然後Hard RoI module利用這些RoI的loss選擇B個樣本。在紅色部分（b）中，這些選擇出的樣本（hard examples）進入RoI網絡，進一步進行前向和後向傳播。

C/C++基本文法學習

STL

C++ primer

Focal Loss(RetinaNet) 與 OHEM

Focal Loss for Dense Object Detection-RetinaNet

OHEM: Training Region-based Object Detectors with Online Hard Example Mining

繼續閱讀

maskrcnn_benchmark代碼分析(3)

maskrcnn_benchmark代碼分析(1)

maskrcnn_benchmark代碼分析(2)

網速太慢？12組網速檢測APP界面設計靈感網速測試、網絡速度測試服務，建議多次測試後取平均值，也可分時段進行測試，如每日

三菱PLC電工技師實訓項目：恒壓供水系統分析與控制工作項目一由單泵組成的恒壓供水控制系統一、任務目的(1)掌握恒壓供水的

40+目标檢測網絡架構盤點！從基礎架構ResNet到最強檢測器Yolov7

網際網路服務品質監測系統通過布放的探針組群，周期進行Ping和Traceroute操作，将曆史資料進行比對，通過門檻值的設定

帶有注意力RPN和多關系檢測器的小樣本目标檢測網絡（提供源碼和資料及下載下傳）

目标檢測網絡中資料集的維數

相比于水稻和小麥，玉米機械收獲過程中籽粒損失率相對較高，開展玉米田間收獲籽粒損失監測研究，對評估聯合收獲機作業性能，實作

檢測網絡PING指令的用法

CVPR2023｜TriDet:高效時序動作檢測網絡，重新整理三個資料集SOTA！

你知道家庭網絡慢的原因嗎？你知道光貓與路由器端口的正确連接配接嗎？正确的網線端口連接配接、以及網線的品質，将直接影響家庭WIFI

人工智能應用場景的窪地：AI+軍工線重點關注;根據美國五角大樓公布的消息顯示，美軍已經派遣200名現役軍官前往台軍新訓中

開發一款APP需要用到哪些工具？大家好，我是産品經理。今天給大家分享一下平時開發過程中使用一些工具，以及個人開發一個AP