天天看點

囿簍·YOLO⑽——「明道如“費”,進道如“退”,夷道如“類”」副标題:帛書《老子》著作名句。囿簍·YOLO發明者提出了

作者:九豐莊主

囿簍· YOLO⑽

——「明道如“費”, 進道如“退” ,夷道如“類”」

副标題:帛書《老子》著作名句。

囿簍·YOLO發明者提出了一種利用現有大量分類資料的新方法:【基于錨框的K次元聚類法】。

K次元聚類(K Dimension Clusters),“聚類”是如下分析處理過程:如果待檢測對象事先還沒有做“标簽”,通過某種彙聚成團的分析方法找出事物對象之間存在聚集性規律。即在沒有劃分類别的情況下,根據資料的相似度進行樣本分組,參見附圖“聚類”。

囿簍·YOLO的【基于錨框的K次元聚類法】是對圖像資料集做邊框聚類運算,求出錨框尺度分布的統計規律。

囿簍·YOLOv2使用K均值聚類方法(K-means)訓練求取邊箱各框次元K,YOLO算法自動找到較好的高寬次元值K用于錨箱初始化。傳統的K均值聚類法使用的是歐氏距離函數,這會出現較大的錨箱會比稍小的錨箱有較多的漏錨情況,聚類結果就可能會偏離源圖本真(Ground Truth)。由于聚類目的是确定更精準的初始錨框參數,即提高交并比的值(IoU),這就應該與錨箱邊框的大小無關,是以YOLOv2采用了交并比之值作為判據,并且,囿簍·YOLO的K均值聚類采用的“圖心距離函數”(Centroid distance)為:

d(box,centroid) = 1 - IoU(box,centroid)

YOLOv2通過先驗性錨箱模型運算,對錨箱尺寸做了K均值聚類運算。如“圖.基于VOC和COCO資料集的框聚類尺度分布”。

圖左邊曲線圖是錨框聚類的簇數和交并比的關系,兩條曲線分别代表兩個不同的資料集VOC和COCO。分析聚類結果并權衡模型複雜度、召回率、交并比值等後,YOLOv2選擇框次元K=5,即選擇了5種大小的“錨框次元K”來進行定位預測。

圖的右側顯示了VOC和COCO資料集的聚類圖形和“圖心”(centroid)。聚類運算結果發現,兩資料集的錨框聚類顯示,其中的“瘦高體”較多,而COCO 内的邊框尺度分布又顯得比VOC更散雜一些。

圖中紫色和淺灰色區域分别表示兩個資料集的不同的錨框聚類。顯然,抽象地看,基本形狀都是類似的;具象地看,聚類的結果中扁長框特征與汽車貼切,而瘦高的框更符合道路行人的特征。

YOLO,“隻瞄一回!”

囿簍,一簍撈盡。

———————

且待下回分解“囿簍”……

囿簍·YOLO⑽——「明道如“費”,進道如“退”,夷道如“類”」副标題:帛書《老子》著作名句。囿簍·YOLO發明者提出了
囿簍·YOLO⑽——「明道如“費”,進道如“退”,夷道如“類”」副标題:帛書《老子》著作名句。囿簍·YOLO發明者提出了
囿簍·YOLO⑽——「明道如“費”,進道如“退”,夷道如“類”」副标題:帛書《老子》著作名句。囿簍·YOLO發明者提出了

繼續閱讀