天天看點

AR介紹

AR全名擴增實境,是一種實時融合現實與虛拟的圖像技術。

AR技術的三闆斧:感覺(尋找目标定位位置-與環境互動),渲染(實作産品互動-與客戶互動),追蹤(捕捉目标運動軌迹-客戶環境上下文)。

目前很多照相軟體都可以實時地讓視訊裡的使用者吐出狗舌頭,戴上貓耳朵,畫上萌萌的胡須,甚至有些軟體可以讓使用者實作AR試妝。這些軟體都具備成熟的人臉感覺能力,包括人臉的位置,嘴巴的開合,甚至五官的位置與輪廓。但是這些感覺是有局限性的,聚焦在相對成熟的人臉感覺領域;要讓機器感覺人類感情或者大千萬物是更為艱難的任務。

深度學習在圖像上的應用已經十分成熟,包括目辨別别模型,圖像分類模型等。我們結合了兩者來實作圖像感覺功能,以下簡述兩者的特點:

目辨別别模型:可以感覺目标物的内容的位置,缺點是感覺能力較弱

圖像分類模型:擁有高感覺能力的“分類模型”,缺點是無法确定目标位置

透過結合分類模型與識别模型優點,對于大部分的物體可以用識别模型識别位置,而難以感覺的物體交給分類模型,并且“猜”一個物體出來。

圖像合成是解決多樣性問題的一種利器。透過圖像合成,我們可以自動化的将任意的目标物,放置在任意的背景:

在綠幕搭配圖像采集工具,大量采集目标物圖像

搭配自動綠幕摳圖,摳出圖像目标

與任意背景圖像合成,并将目标色彩轉換至與背景相近的色彩分布

值得注意的是,圖像合成不在乎合成結果是否合乎邏輯,例如大小與實體定律。合成目的在于教導機器區分前景與背景。

色彩與成像模拟(類似生成畢加索似的畫)是另一種利器。利用兩種自動化算法,可以從已有的圖像轉換成其他攝像頭采集的模拟圖像:

純色彩變化:以圖像B的色彩當作參考,将圖像A的色彩分布轉化與圖像B一緻

響應曲線模拟:将攝像頭A的響應曲線用另一款攝像頭B的響應曲線替代,模拟攝像頭B的生成圖像

繼續閱讀