天天看點

《中國人工智能學會通訊》——9.19 應 用

我們利用 LDL 已經解決了大量實際問題。這一過程中,最為關注的問題之一在于标記分布資料的擷取。其中,有的标記分布來源于先驗知識[11-12] ;有的标記分布直接來源于資料本身[13-14] ;有的标記分布是從資料中學習得來的[15-16] 。

作為最早的一個應用,首先将 LDL 用于人臉年齡估計[11] 。對于人臉年齡估計,其最大的問題在于缺少充足且完整的訓練資料。考慮到人臉的老化是一個緩慢、漸進的過程,引入了一種特殊的标記分布:描述度在實際年齡上最高,并逐漸向其兩邊相鄰年齡遞減。通過産生标記分布,一張圖像既可用于學習其真實年齡,也可用于學習相鄰年齡,進而一定程度上緩解了訓練集不足的問題。

《中國人工智能學會通訊》——9.19 應 用

接着将 LDL 用于頭部姿态估計[12] 。與年齡的特點類似,頭部姿态的變化也是一個連續、漸變的過程,據此可以為每張頭部圖像生成一個二維(考慮水準轉動和垂直轉動兩個角度的姿态)标記分布,其中真實姿态的描述度最高,相鄰姿态描述度随着其與真實姿态的距離增大而逐漸減小。這樣生成的标記分布可以看作目前圖像頭部姿态的一個軟描述,進而緩解了人工标記的姿态不夠精确的問題。

進一步将 LDL 用于電影上映前的評分分布預測問題[13] 。與傳統推薦系統不同,我們通過大衆過去對電影的評分資料,将所有觀衆對一部電影的評分記錄轉化為一個标記分布,即以評分為标記,以各個評分的人數所占比例作為目前評分的描述度,利用 LDL 算法對轉化後的資料集進行學習,并利用學習到的 LDL 模型對電影上映後的觀衆評分分布進行預測。

接下來,将 LDL 用于面部表情情感分布識别問題[14] 。與現有的大多數表情識别方法中認為一種表情隻包含單一情感的假設不同的是,在我們的工作中,假設面部表情是由多種情感混合而成,各個情感都對目前表情具有一定的貢獻度。在此基礎上,引入 LDL 算法,較好地解決了面部表情多情感混合的問題。

此外,LDL 也被用于求解 MLL 問題。目前的MLL 算法假設每個相關标記都具有相同的重要度,而正如前文分析可知,在現實中,标記的重要度往往是不盡相同的。為了解決 MLL 算法中普遍存在的該問題,我們提出通過疊代标記傳播過程,為每個訓練樣例産生标記重要度分布資訊,并通過 LDL 學習該重要度分布資訊,進而更好地求解MLL問題[15] 。

最後還将 LDL 用于自然場景圖像多标記排序問題中[16] 。為了解決對同一幅自然場景圖像,各個排序源給出的多标記排序的不一緻性,通過一個稱為“偏好分布轉化”的過程,将多條不一緻源給出的排序記錄轉化為一個統一的偏好分布。在該分布中,多數人認為重要(即排在前面)的标記描述度也較高,而少數人認為重要的标記也有一定描述度,而不是像常用的多數投票法等去不一緻方法中那樣被完全忽略掉。為每一幅圖像生成相應的偏好分布後,就可以利用 LDL 學習該偏好分布,整個過程既保證了多數人的主流意見,又照顧了少數人的特殊意見,是以預測出的标記排序結果具有更廣泛的滿意度。

繼續閱讀