天天看點

中國95後流行色是什麼?人工智能給出的答案是它

紐約時間 2 月 13 日,QQ 空間、騰訊優圖、唯品會亮相紐約時尚周,聯手舉辦業界首個「AI+時尚」秀。三方還聯合釋出了《AI+時尚:中國 95 後流行色報告》,報告指出中國 95 後年輕人最喜歡的顔色是 RGB 值為 22/20/24 的「黑色」,并被命名為「95度黑」。

中國95後流行色是什麼?人工智能給出的答案是它

中國 95 後的服裝顔色排行

得出上面的結果并非易事。據了解,騰訊優圖借助了人工智能人臉識别與圖像處理技術,分析 2016 年 QQ 空間相冊千億張公開的照片,結合唯品會 95 後服裝銷售大資料,最終發現「95 度黑」等上圖中展示的中國 95 後流行色彩及時尚品味。

雖然實作的技術過程可用上面的語句概述,但中間有着不少技術難點。機器之心對騰訊優圖團隊進行了專訪,騰訊集團副總裁、優圖實驗室負責人梁柱,騰訊優圖實驗室總監黃飛躍博士分别為我們進行了解答。

機器之心:可否講解一下找到 95 後流行色的技術過程和難點?

騰訊優圖:基于機器學習的人臉識别和圖像處理技術,一直以來都是未來技術發展熱點,其應用範圍、落地場景非常廣泛。

借助 QQ 空間相冊的海量圖像大資料及使用者需求回報,騰訊優圖的 AI 圖像識别技術已經發展得十分成熟,并在不同場景下進行廣泛應用。此次與唯品會、張馳合作,是 AI 圖像識别技術在時尚領域的一次應用探索。在大資料的基礎上,我們通過精準識别使用者年齡、鎖定使用者,并對其服裝顔色進行精确分析,幫助設計師更好地捕捉使用者喜好,找到靈感,進而去創作新的時尚風潮。找到 95 後流行色需要跨越兩大技術難點:

一、人臉深度學習,智能識别年齡。首先,精确分析不同年齡的流行色,需要對參與統計的人臉照片進行年齡識别。從 AI 的技術角度出發,首先要給計算機非常多不同年齡的人臉照片資料,然後通過人臉檢測、人臉五官點定位、人臉歸一化處理,再送到一個深度學習網絡中訓練獲得模型,進而對照片人物進行年齡識别。在本次統計中,騰訊優圖将誤差控制在正負 3 歲内,保證資料統計的準确性。

二、人衣分割算法,智能識别顔色。對于流行色研究,最重要的就是對使用者的衣服進行顔色分析,然後進行色系統計。空間裡面使用者上傳的完全公開照片大多數是生活照,是以背景和顔色非常複雜,這是一大技術難點。為了實作準确的顔色擷取,騰訊優圖借助多項人工智能算法,包括人體檢測、衣服分割,将人體和衣服從背景中分割出來。衣服分割的精度直接影響顔色統計的結果,目前騰訊優圖的算法可以做到95%的像素分割精度,也就是說,背景區域被認為是衣服區域的比例,隻占整個衣服區域的5%。精确分割之後,會針對衣服區域做顔色校正和主顔色分析,提取最顯著的RGB顔色值作為衣服的主顔色。對這些提取的顔色值進行直方圖統計,結合人臉年齡分析的結果,得到不同年齡分組的流行色分析結果。

機器之心:95 後的限定涉及到一個年齡的判斷,是否采用了新的算法?限定年齡段的人臉識别,其中最難的地方在哪裡?

騰訊優圖:年齡識别是一個比較典型的問題,關鍵在于準确率如何。騰訊優圖積累了比較多資料,也有很好的算法和模型,能做到平均 3-5 歲的誤差,這在行業是比較領先的。在較高的準确性上,我們的努力方向是最大化技術應用場景。

機器之心:人臉識别的核心問題之一是人臉圖像像素之間高層語義的對齊,即人臉關鍵特征點的定位,錯誤的特征定位會導緻提取的人臉描述特征嚴重變形,進而導緻識别性能下降,騰訊優圖是如何解決這個問題的?

騰訊優圖:這個判斷的核心還是在于識别的正确率,在特征定位上我們能做到 1 個像素誤差左右,屬于業界領先水準。另外在這次的流行色分析中,嚴重變形的人臉作為特例(一般也很少見)會被篩除,保證分析的準确性。

機器之心:面部識别是從像素層級抽取特征,那麼面對最近流行的美顔(對圖像進行高斯模糊)其模糊了人物線條會導緻丢失部分資訊而影響識别率,騰訊優圖又是如何解決這個問題的呢?

騰訊優圖:優圖基于海量資料學習經驗,搭建了一個優秀的模型,即使人臉模糊或有美顔 PS 效果,識别仍能做到很高的準确率,保持年齡誤差在 3-5 歲,在業界是比較領先的。

比如在身份證自拍照對比的人臉識别應用中,有的身份證人臉比較模糊,或者需要用一個人 10 年前的照片去辨識他現在的樣子,這些模糊條件都對人臉識别提出了更高要求,我們優秀的模型和機器學習的魯棒性相容性,能發揮出更好的作用來相容這些問題。

但是不排除會有過度美顔或嚴重 PS 的特例情況,在這次流行色的分析裡,我們會篩除這些特例,保證分析結果的準确性。當然如果在技術應用案例中出現這些案例,深度學習本身也有很高的魯棒性和相容性能夠部分處理。

機器之心:能否介紹一下資料量,包括分析用的照片庫以及訓練用的大規模人臉年齡資料庫?

騰訊優圖:這是利用千億公開照片庫做的分析,覆寫了所有年齡段和全國地域,是一個全面而完整的精确分析。訓練利用了數百萬人臉資料庫,從 10 歲到 70 歲間,每個年齡段都有資料,同時保證資料的均衡分布。

機器之心:流行色是一個已有的概念,每年權威色彩機構 Pantone 都會釋出下一年的流行色,今年的是草木綠,是為來年的流行趨勢做一個訓示引導的作用。這個項目是根據 95 後目前已有的穿着打扮進行分析,就是對已經存在的趨勢進行分析,這個結論除了為設計師迎合市場需求還有什麼作用?有沒有更深遠點的意義?之後這個項目算法還能怎麼拓展用到什麼領域?

騰訊優圖:此次合作,是電商、黑科技與時尚的一次跨界創新應用,讓銷售大資料、人工智能跟時尚流行産生碰撞,讓資料與藝術産生連接配接,也為時尚領域的創作提供更多的靈感和可能性。

AI+大資料的未來,具有很大的想象空間。在這次時尚跨界合作中,圖檔内容的智能識别很關鍵。借助 AI 技術,我們不僅可以很快速地獲得結論,還大大提高了分析人群的覆寫範圍和精準度。以往的定性調查,隻能在有限樣本内進行分析和判斷,而運用 AI 分析,則讓覆寫全國所有地域、所有年齡段的分析有了可能,是以往無法想象的全面性定量分析。

機器之心:您認為今年在人臉識别領域的熱門研究方向是什麼?騰訊優圖對此會有哪些研發計劃?

騰訊優圖:人臉識别技術在理論研究上(較為理想的情況中)已比較成熟甚至取得了超越人眼的技術水準。現階段的難點,反而是在多變的實際應用環境裡,如何通過技術定制和優化,發揮出技術最大的作用。

比如在與公安合作的安防場景人臉識别中,要在百萬人臉中識别罪犯,人臉資料并不是設定好的通用情況,會有很多變化,這時就需要從采集特定資料訓練調優,發揮工程的豐富經驗進行優化,滿足應用需求。

此外,也要從真實的産品需求出發,給出更好的技術建議。如員工刷臉的公司門禁,單靠人臉識别其實并不能達到最佳安防效果,也可以結合其他特征的識别,比如是否佩戴門卡等等,也許可以能更有效地滿足企業的真實需要。

優圖現在為騰訊超過五十個業務提供相關技術支援,并在财付通、微衆銀行、QQ 空間、QQ 音樂、天天 P 圖等明星産品中成功落地。2016 年,優圖推出了開放平台,并和騰訊雲密切合作提供領先的 AI 技術。

中國95後流行色是什麼?人工智能給出的答案是它

騰訊優圖開放平台

經過近幾年的發展,優圖在人工智能多個領域均積累了領先的技術實力和完整的解決方案,主要包括人臉技術、深度學習與圖像了解、音頻語音分析、智能圖像處理等。

人臉識别是優圖的優勢項目,以海量資料和優質模型排名國内前列,并将借助騰訊雲進行更大規模的落地營運。在優勢項目之上,我們還希望發展的目标包括:

1) 覆寫 1:1 的人臉驗證到 1:N 的人臉檢索

在 1:1 驗證中,要證明「我是我」。如沒帶身份證要核對公民身份,優圖能做到通過 88 個采樣點精準面部識别細微特征,再用獨創的基于随機驗證碼的唇語活體檢測技術,大大提高識别安全性。比如「微衆銀行」基于人臉識别的開戶系統流程,以及和公安部門合作的網際網路+警務建設中,在身份證二次申領、居住證、出國簽證等遠端辦理時,市民僅需用手機簡單核對身份,公安機關就能快速稽核

而在 1:N 檢索中,要解決的問題是「這麼多人,哪個才是我」。比如考勤打卡、會議簽到,要做到杜絕僞造簽到。目前該項技術在騰訊衆多自主品牌産品中落地應用,如騰訊深圳濱海新辦公大樓的人臉識别門禁、「騰訊雲」的萬象優圖中即将上線的人臉檢索等等,都有豐富的應用場景。

2) 圖像識别:從 OCR、名片和快遞單的識别,到色情圖檔等更複雜圖像的識别

圖檔鑒黃是優圖實驗室「明星技術」之一。它打破了傳統鑒黃方式限制,日處理達十億量級,精度 99.99% 以上,為微信、QQ 空間、騰訊雲萬象鑒黃等多款産品提供了便利。基于 DeepEye 主動色情識别引擎技術,通過視訊截圖,圖像識别,語音技審,彈幕監控,關鍵字抽取等能力智能識别色情内容,提高鑒黃準确率和實時性。

3)音頻相關算法研發:包括用機器學習算法更好支援 QQ 音樂,如哼唱識别和音樂檢索;基于深度學習的更自然的語音合成系統等等