天天看點

《中國人工智能學會通訊》——11.25 單目視訊下運動物體模組化及分析

特征點軌迹是刻畫視訊中不同圖像幀比對關系的一種常用表示,其首先提取圖像中的特征點,例如Harris 特征點,然後利用 Lucas-Kanade 方法[3]對這些特征點進行跟蹤得到。由于特征點具有顯著性和穩定性的特點,特征點軌迹往往較精确而且可以持續較長時間,進而能準确刻畫物體的長時間運動。如圖3所示,本章主要研究基于特征點軌迹的運動視訊分割,其關鍵在于對同一個物體上軌迹進行運動模組化。

《中國人工智能學會通訊》——11.25 單目視訊下運動物體模組化及分析

已有研究表明,在仿射錄影機下,同一個運動物體上的軌迹在一個低維線性子空間上[4] 。是以基于特征點軌迹的運動視訊分割問題可以轉換為一個子空間聚類的問題。目前效果最好的一類方法是基于自表達的方法,其将每個資料點用所有資料點的線性組合來表示,并通過優化下式得到自表達矩陣 Z*:

《中國人工智能學會通訊》——11.25 單目視訊下運動物體模組化及分析

其中 是資料矩陣,其每一清單示一個資料點;A(X) 是一個字典矩陣,其可以通過學習得到或者直接設定為 A(X)=X; t 是選取的範數;和 分别是正則項和關于 Z 的限制集合;a > o 是一個權衡參數。可以用該自表達矩陣來定義兩兩軌迹點之間相似度,并用譜聚類方法得到分割。常見的方法如表 2 所示[4] 。

《中國人工智能學會通訊》——11.25 單目視訊下運動物體模組化及分析

在理想情況下,表 2 中的方法均可完美解決子空間聚類的問題,這是因為他們均具有塊對角化效應,也就是表 2 中各種方法得到的自表達矩陣 Z ,其不同類别點之間的表達系數為 0 [5] 。我們則在文獻 [4] 中研究了在實際情況下,例如噪聲,退化、耦合等等,什麼樣的方法會更好。我們發現聚集效應(見定義 1)對于子空間聚類是一種很好的性質,它使得式(1)中的優化問題隐含二階光滑限制,進而其對于噪聲更為魯棒,此外,它還使得式(1)求解得到的 Z 中的值更為均衡,這有利于譜聚類算法,也有利于提出更有實體意義的相似性度量。定義1(聚集效應): 給定D維資料點 ,一個自表達矩陣 具有聚集效應當且僅當

《中國人工智能學會通訊》——11.25 單目視訊下運動物體模組化及分析

我們提出了強制聚集效應(Enforced GroupingEffect)條件,該條件大大簡化了針對自表達方法的聚集效應分析。利用這一條件,還可以很容易發現具有聚集效應的新方法。進一步地,基于聚集效應的理論分析,我們提出了顯示增強聚集效應的一種新方法,光滑表達(SMooth Representation)模型,記為SMR,其在人臉、手寫體數字聚類以及視訊運動分割等等問題上均取得了最優異的性能,其中在視訊運動分割領域最重要的資料集之一Hopkins155 [6] 上的評測如表3所示。

《中國人工智能學會通訊》——11.25 單目視訊下運動物體模組化及分析

繼續閱讀