天天看點

人臉識别系統的應用及面臨的問題

    近年來已應用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫療等衆多領域。自2012年後,人臉識别技術的應用呈現出了爆發式增長。目前,技術(算法)、裝置與環境是人臉識别應用三個缺一不可的環節。

    在實驗研究中,大部分算法都是基于LFW(labeledfacesinthewild)人臉庫來測試識别率的。目前人臉識别技術面臨的主要挑戰在于:大姿态角(大于30度)、超低分辨率(人臉分辨率小于30像素)、大年齡跨度(5年以上)和深度學習人臉識别的廣泛應用上。

1、受制于裝置和環境的動态識别

    人臉識别總體上不成熟的三大應用:第一,在高可靠人臉驗證系統上,如支付、社保和門禁,視訊或3d模型存在欺騙問題,錯誤拒絕率(far)在小于0.01%的條件下,拒識率可能高達30%以上;

第二,安防用 “認證一緻性”的驗證系統在far小于0.01%時,拒識率可能高達40%以上,身份證卡内人臉圖像品質差,常小于1kb,現場使用者配合程度不高,且環境也呈現不可控因素;

第三,安防用黑名單監控類應用遠未解決,在虛警率為0.01%時,識别率可能低于10%,視訊品質差,表現出低分辨率、大角度拍攝、光照差的特點,而最大的障礙在于缺少可用的訓練和測試資料。

研發了我國第一款帶有生物特征的法定電子證件的公安部第一研究所副研究員宛根訓則總結,視訊動态人臉識别要在這些基礎之上才能收到良好的效果:“采集裝置為高清視訊錄影機,光線和現場環境相對可控,通道人流方向相對單一,圖像品質有較大改善。”

2、海量資料下如何更快

    人臉識别所用到的深度學習算法是一套模拟人腦的神經網絡算法,通過收集的海量人臉照片,新型的神經網絡算法可以通過大資料訓練将圖檔資訊變成能夠被機器了解分析的結構化資料。

  蘇光大指出:“基于深度學習的人臉識别難度在于訓練的計算複雜度高,計算機不擅長二維計算,大量耗時在深度學習上,這是要解決的問題。”

  那麼,在算法、硬體和環境都達到條件的情況下,如何才能實作海量資料下人臉識别的快速查詢?

  在所有條件都具備時,資料量小的人臉特征随着人員數量增長也會變成大資料。在達到接近甚至超過人臉識别準确率的前提下,每一張人臉可小于1kb。但是,北京博思廷科技有限公司總經理王巍對不同規模的人臉資料庫做了計算:1000萬人臉的資料量可達到10gb,3億人臉的資料量就是300gb。大資料對應的當然就是低速度了,,,

  而速度的下降意味着不能實時識别,這對人臉識别速度要求十分高的反恐、防暴等公安安全監測而言,不是一個好消息。

  例如,公安機關發現一個可能為逃犯的嫌疑對象,需要查詢某身份未知人員的确切身份時,對比幾百萬人的在逃人員身份資訊庫,就會面臨很大壓力。如果要查詢的是一個無家可歸人員的資訊,則要對比戶籍人臉資料庫,而一個省份的戶籍人臉可達到數千萬人。

  如果要查詢某可疑人員此前在何處出現,比如地鐵,每日客流量可達到1000萬人/天,3億人/月,而且每個人可能在多個位置被抓拍多次。這樣下來,人臉識别的資料量簡直不可想象。

  王巍指出,針對一個大小為1000萬的人臉庫的查重,若采用暴力對比法查,需要對比50萬億次。“制約人臉識别查詢速度的因素有兩個,一是基于數學模型的對比方法,最簡單直接的就是暴力對比,效率低、速度慢;二是受限于裝置的處理速度。”王巍說。

他建議,使用兩種方法提升對比效率,一是改變對比方法,盡量避免暴力查詢,如根據人臉圖像屬性切割、歸屬成不同類别,采用二分法可以縮減查詢範圍;二是增加裝置或者伺服器,提高運算能力,或是采用分布式系統架構,并行查詢提升效率。

原文連結

繼續閱讀