一、yolov3的anchor機制

網絡實際的預測值為tx、ty、tw、th,根據上圖中的四個公式計算得到預測框的中心點坐标和寬高bx、 by、 bw、 bh。其中,cx、 cy為目前grid相對于左上角grid偏移的grid數量。 σ()函數為logistic函數,将坐标歸一化到0-1之間。最終得到的bx,by為歸一化後的相對于grid cell的值。pw、 ph為與groundtruth重合度最大的anchor框的寬和高。實際在使用中,作者為了将bw,bh也歸一化到0-1,實際程式中的 pw,ph為anchor的寬,高和featuremap的寬,高的比值。最終得到的bw,bh為歸一化後相對于anchor的值。
二、yolov3的損失函數
yolov3的損失函數采用誤差的平方和整合了預測框定位誤差與有無目标的IOU誤差以及分類誤差,如下圖所示:
值得注意的是,上述圖檔中,定位誤差項的權重一般較大,設為5.為了展現有沒有目标的差別,在IOU誤差項中,有目标box的權重為1,而沒有目标的box的權重為0.5.最後的分類誤差項的系數固定為1,若不含有目标,則為0,相當于不參與計算分類損失值。