天天看點

直播時,阿裡的老司機們都做了什麼?

直播作為近來新興的互動形态,已經成為近幾年最風生水起的行業之一。在2016年仿佛進入了“千團大戰”的繁華。歡聚時代10億砸向虎牙和me直播,斥資1億簽下主播miss;騰訊4億投資鬥魚,後者估值10億美元;新成立的映客獲得昆侖萬維、複賽等機構的8000萬人民币投資;易直播獲得6000萬人民币a輪融資;360推出花椒、秒拍推出一直播....網絡直播正享受其最好的時光,直播"風口"成投資方必争之地。

然而網絡直播也因為走的太快,而失去了出發的初心,主播行為、直播内容變得不可控,低俗、大尺度、無下限成為“勁爆”欄目。針對網絡直播的種種怪相,12月1日,由國家網信辦釋出的,媒體認為“史上最嚴”的《網際網路直播服務管理規定》正式開始施行。《規定》要求直播平台按照“背景實名、前台自願”的原則,對使用者進行行動電話号碼等真實身份資訊認證。而對于網絡主播們,《規定》更要求通過稽核身份證件等更為嚴格的方式進行認證登記。

而這些網絡直播在進行實人認證時,需要對包括姓名、證件号、生物屬性、手機和位置等要素進行識别,如何在提高使用者體驗的同時準确的判斷賬号背後真實的人,也是目前困擾着各大公司的一大難題。目前阿裡聚安全實人認證中使用的技術能夠大大提供自動化認證率和稽核效率。

主播實人認證

主播的實人認證,基于自主研發的證件ocr、人臉識别等實作了88%以上的自動化認證率,并且采用雲(3d、翻拍檢測等)+端(互動動作等)相結合的活體檢測技術來防禦虛假認證的風險攻擊,以确認主播的真實身份,降低違法風險。

對主播進行了嚴格的實人認證:做到人證合一,即根據認證過的賬号身份資訊,能準确找到對應的真實的自然人。

直播時,阿裡的老司機們都做了什麼?

實人認證系統示意圖

其中涉及的智能技術很多,介紹其中兩項。

一、身份證ocr

身份證ocr是把身份證圖像中的文字識别為計算機能認識的文本,自動與公安網等權威資料庫比對,驗證姓名、号碼等資訊的真僞。

基于自由拍攝證件圖像,流程見下圖。為保證識别率和速度,同時融合了傳統算法和深度學習算法。

直播時,阿裡的老司機們都做了什麼?

身份證資訊檢測流程圖

ocr算法對“姓名”字段的識别準确率達98%以上,對“身份證号碼”和“有效期”達99.5%。 系統具有很強魯棒性,以下case都可以輕松識别。

直播時,阿裡的老司機們都做了什麼?
直播時,阿裡的老司機們都做了什麼?

ocr可以識别的身份證舉例

二、生物特征識别

隻介紹人臉識别和人臉活體檢測。

人臉識别在學術界已超肉眼的識别水準,但能在實際中的大規模應用還比較少,原因是實際場景複雜和資料缺乏。挑戰來自光照、姿态、翻拍、化妝、衰老以及低照片品質。

我們對使用者真人人像、身份證照、權威資料庫的頭像進行兩兩比對,以驗證身份的真實性。算法能在0.1%的認假率下,使得合法使用者自動通過率達93%以上。

人臉識别包括圖像擷取、人臉檢測、活體檢測、關鍵點定位、特征提取、識别引擎等子產品。

直播時,阿裡的老司機們都做了什麼?

人臉識别系統

1、人臉檢測

采用boosting+rcnn架構。

直播時,阿裡的老司機們都做了什麼?

人臉檢測結果圖

2、活體檢測

活體檢測是為了確定待認證的使用者是“活人”,而不是事先拍好或翻拍的人臉照片、視訊,防止虛假認證,降低主播的違法風險。

直播時,阿裡的老司機們都做了什麼?

活體檢測執行個體圖

活體檢測子產品包括:

人臉檢測

檢測是否出現人臉,且不能是多張臉, 防止不同的人切換或人與照片的切換。

3d檢測

驗證是否為立體人像,防止平面的照片或視訊攻擊。

直播時,阿裡的老司機們都做了什麼?

3d檢測示意圖

活體算法檢測

驗證使用者的操作是否正常,指定使用者做随機動作(凝視、搖頭、點頭、眨眼、上下移動手機等)。

連續性檢測

防止中途切換人。

翻拍檢測

利用深度學習技術, 區分擷取的人像是否為對螢幕、照片的翻拍。

3、人臉關鍵點定位

定位出眉毛、眼睛、鼻子、嘴巴等位置。主流方法有:基于參數模型的方法;基于回歸的方法;基于深度學習的方法。

我們采用基于特征的回歸方式+深度學習的方法,來訓練關鍵點定位模型。

直播時,阿裡的老司機們都做了什麼?

人臉關鍵點檢測示意圖(圖檔素材來源網絡)

4、特征提取

直播時,阿裡的老司機們都做了什麼?

maxout結構示意圖

我們同時采用了傳統人臉特征(wld, hog,lbp,gabor等)和基于深度學習(基于vgg、googlenet、maxout三者的融合網絡)的特征進行人臉識别。

5、識别引擎

傳統人臉特征,我們采用svm進行pairwise距離度量;dl人臉特征,對已經學習的分類模型進行微調。

實人認證自動化是基于人臉、ocr的識别結果,基于大資料,綜合利用使用者的行為特征,進行多元度資訊融合,最後得到綜合決策模型,實作自動決策的過程。而在目前網際網路發展的多種業務中,實人認證技術的應用場景紛繁複雜,對技術名額的要求也不盡相同,阿裡聚安全提供的實人認證技術以生物識别、無線安全技術為支撐,保障實人認證有效性。

目前,阿裡巴巴人臉識别技術已在實際場景中大規模應用,實戰中相關性能名額在fpr(false positive rate)0.1%情況下,tpr(true positive rate)達96%,識别準确率遠遠超過人體肉眼識别。

本文作者:左芬

繼續閱讀