作為模式識别中至為重要的一個環節,特征表示直接影響着整個智能系統的學習性能。傳統的圖像特征表示一般基于原始圖像的低層特征,如側重于刻畫紋理資訊的Local Binary Pattern(LBP)特征、側重于方向資訊的 Gabor 特征和尺度不變特征變換(Scale Invariant Feature Transform,SIFT),以及側重于局部形狀資訊的方向梯度直方圖(Histogramsof Oriented Gradients,HOG)特征等。随着腦科學和認知科學的發展,研究者發現人類認知目标的特點是對圖像局部灰階的具體數值和變化具有高度不變性,并能從整體上歸納出該對象的典型特征而加以抽象。是以,他們開始嘗試從人類認知的角度設計新的、更為抽象的特征表示。作為圖像的語義模組化方法,屬性表示正是這一研究思路的自然成果。本文主要關注圖像的語義模組化方法——屬性表示。
屬性表示,即決定如何刻畫對象或事件中哪些視覺上的特質,是實作屬性學習的基礎問題。現有的研究中主要存在三種類型的屬性,即視覺屬性(如“紅色”、“圓形”和“條狀”等)、部件屬性(如“有翅膀”、“有耳朵”和“有嘴巴”等)和相似屬性(如“類似于狗”、“比老虎小”和“不像汽車”等)。從上述分類可以看出,差別于低層特征,屬性是對目标類的一種進階特征描述(如圖 1 所示),往往包含一定的語義資訊。同時,屬性表示與低層特征有着密切聯系。一方面,屬性是對低層特征的抽象和概括,是對低層特征的一種語義描述;另一方面,對象的低層特征是實作屬性描述的基礎,沒有低層特征就沒有屬性表示。當然,低層特征中蘊含的資訊遠遠比屬性描述更豐富,而且一個屬性往往隻能描述對象的某個側面,不能反映對象的本質。例如,僅僅一個“條紋”屬性通常很難反映“斑馬”這一對象類的本質特點,即很難通過某些單獨的屬性達到“窺一斑而知全豹”的效果。即便如此,我們及其他研究者[1-3]仍認為,屬性作為一種對象類别的描述方式,具有低層特征不具備的以下優點,例如可推廣性、可解釋性、靈活性、經濟性等。正是由于應用屬性描述對象的上述優勢,使得屬性在複雜易變的學習環境中十分有用,并被廣泛應用于對象識别[4-5] 、人臉驗證 [6-8] 、動作識别 [9] 、圖像檢索 [10-11] 、姿态估計[12-13]和零樣本學習[14-17]等實際問題。

屬性學習的核心思想是通過一組屬性表示和訓練資料建立一個映射,将資料的低層特征映射到屬性表示層,并基于屬性表示建立具有高精确性和高魯棒性的學習系統。無論從機器學習理論與算法研究角度,還是從與其密切相關的實際應用角度,屬性學習都具有重要的研究意義。屬性學習問題涉及屬性表示、特征提取、特征選擇和分類器設計等衆多領域,但限于篇幅及研究側重點,本文主要探讨屬性表示、屬性關系學習、屬性特征選擇和屬性分類器設計方法,通過充分挖掘和利用資料内在的結構資訊及其包含的豐富中低層視覺資訊,建構并發展高準确度和高魯棒性的屬性學習模型,提升機器在複雜學習場景下對目标類的基本認知能力和了解能力。為此,本文的研究工作主要包括以下四個部分。