天天看點

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

預測特征圖的屬性

  • RGB3通道圖像被輸入到yolov3網絡。
  • 檢測結果在三個不同的尺度下輸出,包括目标的坐标位置、目标是正樣本還是負樣本、目标屬于某一類置信度。
  • 對于每個比例尺分支,在每個網格單元中預測三個結果(每個比例尺三個錨)。
  • 結合三個尺度的結果,進行非最大抑制(NMS),輸出最終的測試結果。

如yolov3的輸出所述,目标類别有一個機率值,但目标框隻有一個位置,沒有機率值,即無法從結果預測目前目标幀的可靠性。在此基礎上,本文采用高斯模型對網絡輸出進行模組化,在不改變yolov3的結構和計算量的情況下,可以輸出每個預測幀的可靠性,使算法的整體性能提高了3個點。地圖。

高斯 YOLOv3

Gaussian yolov3通過增加網絡的輸出和改善網絡的損耗函數來實作預測幀可靠性的輸出,如下圖所示:

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

拟議算法的預測框中的元件

由此我們可以看出,與原始yolov3在坐标預測中輸出4維不同,高斯yolov3在邊界框的坐标預測輸出中包含8維。

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

這八個次元相當于預測框的中心坐标和長寬,以及相應預測框的不确定性。以目标盒的位置為高斯分布的均值,相應的不确定度為方差,将手指模組化為四個高斯分布。如下面的對準代碼所示,高斯yolov3通過預測每個坐标位置的不确定性來提高最終預測prob值的精度。

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

由于高斯yolov3的輸出被調整,相應的損失函數的計算将相應地被調整。與原yolov3相比,隻調整了預測幀坐标位置的回歸政策。如下面的代碼比較所示,當原始yolov3執行box回歸時,由于網絡預測輸出是坐标本身,是以在計算梯度時使用均方誤差。由于高斯yolov3輸出均值和方差,是以在計算梯度時結合高斯分布政策。

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器
高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器
高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器
高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

高斯yolov3的損失函數如下:

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

高斯yolov3算法結果:

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器
高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

在KITTI驗證集中的基線和建議算法的檢測結果。第一列顯示檢測YOLOv3的結果,

而第二欄顯示高斯YOLOv3的檢測結果

高斯YOLOv3定位不确定性進行自動駕駛的精确快速物體檢測器

BDD測試集中的基線檢測結果和建議的算法。 第一和第二行顯示檢測

YOLOv3和高斯YOLOv3的結果,每種顔色都與特定的對象類相關。

結論

目标檢測算法的高精度和實時檢測速度對于自動駕駛汽車的安全性和實時控制。與基于攝像頭的自動駕駛相關的各種研究雖然已經進行了一些操作,但是基于精度和操作速度之間的權衡,這并不令人滿意。對于是以,本文提出了一種目标檢測算法,該算法在精度和自動駕駛的速度。通過高斯模組化,損失函數重構以及定位不确定性,改進算法精度,提高TP并顯着降低FP,同時保持實時功能。與基線相比,建議的高斯YOLOv3算法将KITTI的mAP提高了3.09和3.5和BDD資料集。此外,因為提出的算法具有比以前的研究相似的fps更高的精度,該算法是在精度和檢測速度之間的權衡方面表現出色。結果,所提出的算法可以顯着改善用于自動駕駛的基于相機的物體檢測系統。

相關論文源碼下載下傳位址:關注“圖像算法”微信公衆号 回複“高斯”

繼續閱讀