目标跟蹤-VOT的Bounding Box的生成準則
1.介紹
目标跟蹤:在第一幀給定目标位置,在後續幀中預測目标的位置。
為了友善表述,早期的跟蹤算法都是坐标軸對齊的的矩形框。但随着跟蹤精度的不斷提升,資料集的難度在不斷提升,在VOT2015時即提出使用旋轉矩形框來作為标記。在VOT2016的時候提出自動的通過mask來生成旋轉框的方法。
http://cmp.felk.cvut.cz/~vojirtom/dataset/votseg/data/Vojir-TR-2017-01.pdf
如下圖所示。第一列是原始圖像。第二列是手動标注的目标像素。第三列的紅色框是手動标注的bounding box。綠色框是算法自動标注的bounding box。
2.VoT确定bounding box ground truth 的準則
準則:
(1)盡量減少bounding box外的目标像素個數。
(2)盡量減少bounding box内的背景像素個數。
(3)目标像素在bounding box的比例小于 Theta_f。
(4)bounding box内背景像素的比例小于 Theta_b。
3.VoT确定bounding box ground truth 的實作方法
輸入:
(1)手動标記的mask圖
(2)三種bounding box 的初始值:
(a)手動标注的bounding box;
(b)坐标軸對齊的最小框;
(c)允許旋轉的最小框。
輸出:滿足限制并且最小化目标函數的bounding box
最優化方法:内點法
英文論文:
H. R. Byrd, C. J. Gilbert, and J. Nocedal. A trust region method based on interior point
techniques for nonlinear programming. Mathematical Programming, 89(1):149–185,
2000. 4
https://www.researchgate.net/publication/225151347_A_Trust_Region_Method_Based_on_Interior_Point_Techniques_for_Nonlinear_Programming
中文介紹:
https://baike.baidu.com/item/内點法
http://www.360doc.com/content/17/0423/20/32196906_648054634.shtml
VoT給出的Matlab代碼:
http://cmp.felk.cvut.cz/~vojirtom/dataset/votseg/data/optimize_bboxes.m
VoT環境配置
最後推薦幾個VoT環境配置的中文介紹
(1)先了解以下需要避開哪些開坑
那些年,我被VOT工具坑的日子
https://blog.csdn.net/aiqiu_gogogo/article/details/79454997
(2)詳細步驟--------把别人的程式跑起來。
VOT 2015 Benchmark 使用教程
https://blog.csdn.net/shmilysi/article/details/52972157
(3)進階-------修改自己的代碼,讓他符合VOT的運作格式
https://blog.csdn.net/yao1131/article/details/78783236