天天看點

北大團隊研發“車臉”識别系統,不看車牌看外觀特征實作精确識别

北大團隊研發“車臉”識别系統,不看車牌看外觀特征實作精确識别

北京大學資訊科學技術學院田永鴻等三名研究人員研發了根據汽車外觀特征,而非掃描車牌号來精确識别攝像頭拍攝的車輛的新技術。研究人員稱該項技術也能用于人臉識别和行人檢測,能為偵破盜竊車輛等案件提供幫助。

據《參考消息》8月30日引西媒報道,北京大學資訊科學技術學院田永鴻等三名研究人員研發了根據汽車外觀特征精确識别攝像頭拍攝的車輛的新技術。該系統不再依靠掃描車牌号,而是基于對車輛外觀特征的記錄和分析,如輪廓線條、碰撞損傷或漆面刮痕等,依據這些特征資料搜尋出機動車的型号和注冊資訊。

研究人員将這一多任務學習架構命名為“repression network (repnet)”,識别車輛依據的名額分為兩類,一類是車輛外觀的“一般細節”,如顔色、品牌、型号等;另一類是車輛的外觀缺陷和損傷。

報道稱,在目前階段,還無法确定repression network系統将于何時投入應用,因為其應用可能會被認為侵犯了隐私權。但可以确定的是,如果利用該系統對視訊監控系統記錄的車輛影像進行識别,一定能為偵破盜竊車輛等案件提供幫助。

研究人員在論文中描述了根據汽車外觀特征精确識别攝像頭拍攝的車輛影像的新技術。他們表示,這種系統也能用于識别人臉特征。

研究人員稱,公共安全系統監控攝像頭的大規模使用,創造了一個龐大的圖像和視訊資料庫,為車輛識别和搜尋提供了重要的技術支援。雖然車牌是汽車的一個重要身份特征,但許多監控攝像頭并非是為掃描車牌設計的,此外車牌識别系統在識别混淆字元時的表現非常糟糕,比如區分 8 和 b,o、d 或 0,是以他們提出這種以車輛外觀特征資料為依據的精确識别系統。

論文:learning a repression network for precise vehicle search

作者:qiantong xu, ke yan, yonghong tian

北大團隊研發“車臉”識别系統,不看車牌看外觀特征實作精确識别

摘要

在公共安全中監控攝像頭使用的日益增多凸顯了大型圖像資料庫對于車輛搜尋(vehicle search)的重要性。精确車輛搜尋(precise vehicle search)的目的是根據給定的需查詢的車輛圖檔,搜尋出所有執行個體。這是一項具有挑戰性的任務,因為不同的汽車外形都非常相似。為了解決這個問題,我們提出一個新的多任務學習架構,名為 repression network (repnet),用以同時從粗粒度和細粒度級别學習每張汽車圖像的辨識特征。此外,從屬性分類方法的高準确率得到啟發,我們提出一種桶搜尋(bucket search)方法,在減少檢索時間的同時仍然保持競争力。我們對經修改的vehcileid [1]資料集進行了廣泛的實驗,實驗結果表明,我們的 repnet 實作了 state-of-the-art 的性能,并且 bucket search 的方法将檢索時間縮短了約24倍。

北大團隊研發“車臉”識别系統,不看車牌看外觀特征實作精确識别

圖1:具有prl的repnet中不同層的特征的顯著性圖(saliency map)。在顯著性圖中,亮度越高的區域表示原始圖像中該區域的資訊越多,嵌入到給定的特征向量中。上圖第1列是查詢圖像(query image),第2列至第5列分别顯示4個特征向量的顯著性圖:fbase,fmodel,fcolor和fsls-3。

北大團隊研發“車臉”識别系統,不看車牌看外觀特征實作精确識别

圖2:repnet将三個一組的圖像作為輸入,并通過三個網絡(包括卷積組,fc層和具有共享權重的repression層(rep))進行饋送。輸出特征的名稱和大小列在每一層上方和下方。 repression層采用兩個特征向量fsls-1和facs作為輸入。隻有每個組中的 anchor image 被用于屬性分類,即隻有它的網絡具有fc層和facs之後的損失函數。

北大團隊研發“車臉”識别系統,不看車牌看外觀特征實作精确識别

圖3:具有prl的repnet中不同層的特征的顯著性圖和具有相同結構但有repression層的網絡。第一列是query image,右邊的兩組4列分别是從兩個網絡分别學習四個特征向量(fbase,fmodel,fcolor和fsls-3)的顯著性圖。

實驗結果

北大團隊研發“車臉”識别系統,不看車牌看外觀特征實作精确識别

圖4:不同模型的精度曲線。ls和bs是線性搜尋(linear search)和桶搜尋(bucket search)的縮寫。

結論

在這篇論文中,我們提出了一個多任務學習架構,用于有效地生成屬性分類和相似性學習的細粒度特征表示。repression層被設計用于将從特征分類學習的資訊嵌入到表示每輛車的特定細節特征中,并且還用于平衡兩個fc層流的權重比例。通過向vehicleid資料集添加一個新屬性,我們用修訂後的資料集進行了廣泛的實驗,證明了我們的架構和repression層的有效性——linear search具有更高的圖像檢索精度,以及bucket search使檢索時間更少。這些優點值得進一步調查repnet學習細粒度特征表示,例如引入哈希函數來生成二進制特征或将卷積組分成兩組。此外,我們的架構還可以推廣到更廣泛的應用,例如人臉識别和行人檢索。

原文釋出時間為:2017-08-31

編輯:劉小芹

本文來自雲栖社群合作夥伴“新智元”,了解相關資訊可以關注“新智元”微信公衆号

<a href="https://mp.weixin.qq.com/s/fqpz8ehginupxumvtmsecw">原文連結</a>