天天看點

提到圖像資料脫敏,看這家公司如何了解

作者:九章智駕

作者:奚少華

在10月份九章智駕釋出過一篇名為《一文讀懂資料脫敏技術在智能汽車中的應用》的文章,該文提到,目前智能汽車行業内,車端需要脫敏的敏感資料範圍僅限于車端采集到的視訊及圖像中的人臉和車牌資訊。此外,在中汽協釋出的《汽車傳輸視訊及圖像脫敏技術要求與方法》(以下簡稱《方法》)中,也對功能要求、脫敏方法、結果評估等相關内容提出要求。

目前《方法》已正式釋出,各家主機廠也針對此項要求紛紛做出回應。

業内一家名為江蘇源駛科技有限公司的企業,已提前探索研究圖像資料脫敏在智能汽車領域中的應用,并率先實作方案落地應用。

筆者近期與源駛科技的CEO周翔及副總經理李鵬進行了深入交流訪談,并整理出下文,以供讀者參閱。

一、為何說圖像資料脫敏如此重要?

随着L2級自動駕駛技術的不斷發展,人機共駕成為了普遍現象,相機作為車外感覺以及車内駕駛員監測的主要傳感器,其産生的圖像敏感資料越來越多,導緻資料安全問題在智能汽車領域日益凸顯。

一方面,車内外圖像的隐私洩露問題嚴重。近兩年,由于車端相機功能引起的資料安全事件屢屢出現,比如高合汽車曾被爆出“車車互聯”功能之下,車主能看到陌生車主的行車記錄儀畫面;再比如特斯拉的車内相機所拍攝到的視訊圖像資料被黑客盜取。這些圖像資料在未經車主同意前,就被随意采集和存儲,存在嚴重的隐私洩露風險。

另一方面,主機廠對于圖像資料的傳輸、處理等過程中存在不規範性。在相關規定尚未出台前,主機廠認為資料是屬于自己的,自己可以肆意收集,因而在整個資料全生命周期中,沒有做出任何敏感資料的保護措施。

上述問題促使智能汽車行業相關政策不斷地被推出。

2021年7月,國信辦、發改委、工信部、公安部、交通運輸部聯合釋出了《汽車資料安全管理若幹規定(試行)》(以下簡稱《若幹規定》),明确了6類重要敏感資料,其中第四類就是“人臉資訊、車牌資訊等的車外視訊、圖像資料”。

2022年8月,中汽協釋出的《汽車傳輸視訊及圖像脫敏技術要求與方法》,明确了相關圖像資料脫敏的技術要求與方法标準,這也是在《若幹規定》的基礎上,對圖像資料脫敏做出了詳細的技術标準規範。

那麼,智能汽車發展仍處于早期階段,而行業的強監管是否會與此相沖突?

周翔說:“目前的監管趨嚴,提高了主機廠和Tier 1的成本,但資料監管對行業發展是有利的,尤其是針對現階段L2以及L2+級别的自動駕駛技術,若沒有資料監管,資料就會處于裸奔的狀态,會産生很多風險。”

在相關政策推出後,主機廠提高了對資料脫敏的重視度。

李鵬提到,預計在往後的半年内,圖像資料脫敏将處于SOR階段(需求規範),主機廠會對供應商提出資料脫敏的相關要求,其中除了增量市場外,還包括一些存量市場。比如前期被迫關停的360哨兵功能/環視/行車記錄儀等,也迫切需要供應商再次洽談在相關功能加入脫敏需求。

二、圖像資料脫敏技術在智能汽車中的應用

上文我們了解到圖像資料脫敏在智能汽車領域中應用的重要性和迫切性後,那麼,我們接着來看下,圖像資料脫敏技術具體是如何應用在智能汽車領域?筆者将從5個次元來具體闡述這個問題,包括适用的資料範圍、适用的資料要求、圖像脫敏的方法、圖像脫敏的執行、脫敏後的資料要求。

2.1 适用的資料範圍

《若幹規定》的第三條中提到:“重要敏感資料包括人臉、聲音、車牌等的車外音視訊資料,該條例隻是針對車外的圖像資料”,但随後出台的《方法》标準卻又提到“适用于對車端采集的視訊及圖像中的人臉和車牌資料脫敏處理”,該标準并沒有僅限于車外圖像資料,也就是說,車内(人臉)和車外(人臉+車牌)的圖像資料都需要脫敏。

2.2 适用的資料要求

在确定好适用的資料範圍後,接下來的問題就是怎樣的資料需要脫敏,對此,《方法》中已對資料格式及圖像品質要求做了較為明确的規定。

首先,《方法》規定了車端資料處理裝置應支援原始二進制資料進行脫敏,并且上傳到雲端的資料需要至少滿足以下的格式要求。

  • 圖像檔案格式:JPEG、JPEG2000、BMP、PNG中的任一種;
  • 視訊編解碼格式:H.264、H.265、MPEG-4的任一種;
  • 視訊檔案格式:mp4、 avi、 mov、 wmv、 3gp的任一種。

其次,《方法》也規定了人臉和車牌的圖像品質要求,不僅包括人臉圖像的分辨率、姿态、完整度、清晰度、圖像RGB需要滿足的強度,還包括車外車牌的圖像分辨率、最低照度、幾何失真、運動模糊下的可識别度。

提到圖像資料脫敏,看這家公司如何了解
提到圖像資料脫敏,看這家公司如何了解

圖:人臉和車牌的圖像品質要求

除此以外,若圖像資料不能滿足上述要求,就不需要做任何脫敏處理。

李鵬說:“圖像資料脫敏技術跟自動駕駛技術是不太一樣的,它主要取決于車牌和人臉的圖像是否清晰,若圖像都已經不清晰了,那其實已經不需要做脫敏處理了。比如高速場景下,前方的圖像已經出現拖影現象了,也就降低了脫敏的要求,甚至不需要脫敏了。”

是以,圖像資料脫敏技術的應用與具體的應用場景無關,比如高速或者城區,其技術性能主要是取決于相機性能的差異,比如感光度、動态性等。

2.3 圖像脫敏的方法

在确定了适用的資料範圍和資料要求後,圖像脫敏具體需要什麼樣的技術方法?

《方法》指出,圖像資料脫敏的主要方法有擦除、統一色塊塗抹等,但不包括低像素化處理與打馬賽克。從中可以解讀出:

  • 具體方法有擦除、統一色塊塗抹等;
  • 脫敏後的圖像需要具備不可逆性——圖像不能被還原。

雖然,某主機廠資訊安全工程師提到,圖像脫敏的技術難度本質上并不高,在其它領域已有相應的成熟應用,但車端的相機所采集的圖像資料往往是處于動态的狀态,這就需要引入一些相關技術,來定位每幀圖像中的敏感區域。

周翔說:“以前的圖像脫敏技術主要是使用目标跟蹤,而現在SoC算力加強後,脫敏技術可以直接檢測出敏感區域。”

李鵬也說:“脫敏算法在智能汽車上的應用,其本質上很像主動安全的感覺功能,但是脫敏的工作會比原先主動安全的難度要小很多。”

看上去脫敏技術的門檻似乎并不高,但事實是否真是如此?

關于車端圖像資料脫敏的技術難點,李鵬說:“目前圖像脫敏技術主要是基于深度學習,技術強弱取決于用于訓練模型的資料樣本量的充足度和應用場景的多樣性。”

總的來說,若要做好圖像資料脫敏,關鍵還是要依賴于前期自動駕駛技術的經驗積累,包括資料的積累、算法訓練經驗的積累等。

2.4 圖像資料脫敏的執行

《方法》指出了圖像資料脫敏的執行流程,包括圖像資料的輸入、預處理、敏感區域的定位、脫敏處理、後處理、圖像資料的輸出。

圖:圖像資料脫敏的流程

(資料來源:《汽車傳輸視訊及圖像脫敏技術要求與方法》)

該執行流程主要是圖像資料脫敏的流程,但圖像資料脫敏在與自動駕駛技術相結合應用時,具體又是如何操作的?

針對這個問題,李鵬說:“圖像資料脫敏并不會在自動駕駛的任何層面進行(比如感覺、定位、決策、控制),由于脫敏算法可能會對自動駕駛算法造成時延的影響,是以資料隻需要在向外部傳輸的時候才執行脫敏的動作。

“舉例來說,在哨兵模式下,使用者在檢視背景資料時,資料需要在傳輸前就進行脫敏處理,是以使用者是不會看到敏感資訊的。本地存儲資料可不做脫敏處理,但是在進行任何形式的向外傳輸前都會先脫敏。

“再比如,當車輛的多個視覺感應器檢測到的環境資料差距過大時候,車端的資料就需要全部上傳至雲端進行重新訓練,這個時候圖像資料也需要脫敏處理。”

2.5 脫敏後的資料要求

對于脫敏後的圖像資料,《方法》也指出了相應的要求。

第一,脫敏後的圖像應滿足人眼無法識别,并且敏感區域無法被相關技術複原,比如基于深度學習的圖像超分辨率重建或基于生成對抗網絡的圖像複原等技術。

第二,人臉或者車牌的交并比(IoU,注:交并比為産生的候選框與原标記框的交疊率,即它們的交集與并集的比值,完全重疊時,比值為1)應滿足50%-75%。

第三,原視訊中的每一幀圖像在脫敏處理後,需要将其按照原視訊的編碼、幀率資訊等轉化為新的視訊,并且轉化後的視訊格式必須與原格式保持一緻。

三、圖像資料脫敏在智能汽車中的挑戰

3.1 技術方面的挑戰

目前,相機已經成為了自動駕駛技術解決方案中不可或缺的傳感器,而随着車載相機性能的不斷提升、種類也越來越多,一方面,相機的性能從百萬級别像素到4K、8K等,造成了圖像資料的清晰度越來越高;另一方面,相機的種類非常多樣且複雜,包括車外的單目、雙目、多目、環視等,以及車内的DMS、OMS等。

基于這些因素,圖像資料脫敏會面臨一些技術方面的挑戰。

首先,各種相機的性能越高,也就意味着會造成更多高品質的圖像資料,在清晰度上也更容易滿足圖像資料脫敏的要求,這就會帶來大量的敏感資料。

其次,應用于各種場景的相機,由于對應功能需求不同,其圖像資料脫敏所需要的技術方案也會所有差異,這就需要更深的場景了解能力和相應的深度學習能力。比如某些魚眼相機的水準FOV非常大,可達270°(如應用于哨兵模式),它在擷取到更多的敏感資料的同時,也需要對圖像資料采取實時脫敏。

3.2 工程化方面的挑戰

在工程化方面,圖像資料脫敏最大的挑戰在于脫敏算法的遷移難度,即如何将圖像資料脫敏方案部署在不同的SoC平台上。

關于這個問題,以實際項目落地經驗為例,李鵬說:“首先,大平台大算力的晶片容易做圖像脫敏,而某些性能不足夠的SoC晶片,算力非常有限,在保證原有系統業務正常運作的基礎上,再去部署圖像脫敏的算法,圖像脫敏所配置設定到的算力相當有限,就會影響資料脫敏的效率。

“其次,現如今不同SoC晶片上的架構也存在差異,進而造成性能占用的差異比較大,比如某些SoC晶片是基于ARM的處理器,它可能會配置A53或者A55的核,而每一個處理器的性能也會不同,有些配置有GPU,而有些卻沒有。

“再者,不同主機廠對圖像資料脫敏的需求也會不同——有些主機廠希望把資料脫敏部署在GPU上,這就會導緻GPU的占用較大,而有些則希望GPU不被占用,進而希望把資料脫敏部署在CPU上。”

四、如何應對相應的挑戰

面對上述的挑戰,行業該如何去應對?随着圖像資料脫敏日益迫切,各家資料廠商也會有着相應的應對政策,其中,一家圖像資料脫敏廠商通過結合自身的特點及行業發展的現狀,介紹了自己的應對政策。

4.1 這家公司是誰——源駛科技

至此,讀者可能會好奇:源駛科技到底是一家怎麼樣的企業?

據源駛科技方面介紹,公司由華設設計集團股份有限公司(以下簡稱“華設集團”)與深圳佑駕創新科技有限公司(以下簡稱“MINIEYE”)共同出資籌建,旨在推動國内車路協同式自動駕駛産業發展,緻力于成為以軟硬體全棧式研發能力為核心的數字交通服務商。

那麼,作為一家定位于數字交通服務商的企業,源駛科技為何會選擇布局圖像資料脫敏業務?

周翔說:“總的來說,首先這是行業和監管的趨勢,公司響應了政府的相關号召,現在大衆對于個人隐私保護的意識越來越強,監管部門和企業也意識到了這一點,我們的研發團隊在圖像資料脫敏的領域做了很多相關的技術儲備,可以賦能行業内的其他企業。

“第二,目前主機廠在對外招标時,就要求Tier 1所提供産品需要具備圖像資料脫敏技術。雖然部分主機廠有能力自研圖像脫敏技術,但自研的時間和金錢成本相較于直接使用現成的解決方案産生的成本,就不一定具有優勢。同時,法規不僅被強制應用于所有新車型,還覆寫了目前已上市的車型,即存量市場。源駛科技也即是抓住了這樣一個市場契機。

“第三,公司憑借股東MINIEYE在車載行業的算法積累優勢,有相對完備的技術支撐,可以完成圖像資料脫敏業務。”

4.2 公司面對挑戰提出的相應對策

4.2.1 技術方面的對策

上文也提到,相機的性能提升帶來了圖像資料清晰度的提升,進而帶來了敏感資訊數量的增加,也使得圖像脫敏的潛在需求增加了,這最終會降低脫敏的效率。舉例來說,原先相機性能不佳的狀況下,某些圖像資料由于不夠清晰,也就不存在脫敏的需求了,但相機性能增強後,高度清晰的圖像可能會迫使對每幀圖像進行脫敏。

面對這方面的挑戰,李鵬以使用者側(車主)為例做了分析。他說:“使用者在通過手機或者其它移動裝置連上車輛時,車端會實時推送視訊流和圖像資料給使用者,而這些可能就是8MP相機産生的圖像資料,但是在實際資料傳輸過程中,資料會被做一定的壓縮或裁剪,公司會在裁剪後的視訊流上部署脫敏算法。這樣既滿足了使用者對隐私安全的需求,也滿足了使用者實時查閱圖像資料的需求。”

4.2.2 工程化方面的對策

對于脫敏算法在不同SoC平台之間移植的挑戰,源駛科技是如何應對的?

李鵬說:“首先,公司對各個SoC的性能會有一定的了解,針對不同客戶的需求來做評估,并做出定制化方案,比如360環視功能在部署資料脫敏算法時,客戶會要求脫敏算法不占用GPU的性能,是以會将脫敏算法直接部署在CPU上運作;其次,在不影響原有業務的基礎上,針對不同的SoC特性,公司會做合理的資源利用。比如,某些SoC平台擁有NPU加速單元,并可以流暢地運作脫敏算法,那就完全不需要去占用GPU或者其它硬體性能。”

4.3 公司具備的優勢

若要能夠自如地應對相應的挑戰,自身的基本功也是必須要打磨的。

首先,源駛科技具備了什麼樣的技術體系?

周翔提到,源駛科技的整個體系來自于MINIEYE的技術架構,無論算法還是軟硬體,都沿用了MINIEYE的成功經驗。

從算法層面來看,MINIEYE自研的ThiNet(神經網絡壓縮架構)、FastNet(嵌入式神經網絡加速庫)、HardNet(神經網絡架構IP)等神經網絡,可以讓公司快速積累Know-How的相關經驗。

從軟硬體層面來看,公司吸收了MINIEYE在ADAS和艙内感覺的量産經驗。

硬體方面,主要有商用車雙預警ADAS産品和乘用車智能駕駛域控制器在東風、柳汽、陝汽、奇瑞、比亞迪等客戶的量産經驗;艙内軟體方面則有在吉利、上汽、順豐速運等客戶的量産經驗。

其次,在上述技術體系的支撐下,源駛科技形成了自己獨特的優勢,筆者總結了3個方面的優勢。

4.3.1 技術及工程化方面的優勢

(1)算法移植能力

算法移植能力可以幫助公司更好地将資料脫敏技術應用在不同平台的SoC晶片上,解決硬體差異所帶來的工程化問題。

關于公司具備的算法移植能力,周翔說:“首先,算法若要更好地應用,就需要足夠樣本的資料量。在圖像資料經驗的積累上,源駛科技繼承了MINIEYE積累的資料集,包含了多種類型的資訊,這些資料都會導入進源駛科技的技術體系,幫助公司提升資料處理能力。

“再者,算法移植能力也需要對主流SoC晶片的硬體性能有一定的了解。MINIEYE積累的高通、Xilinx、TI等主流平台的開發經驗,以及與地平線達成的戰略級合作關系,這些都會為源駛科技的算法移植開發提供有力支撐。”

(2)圖像脫敏速度

衡量圖像資料脫敏的關鍵技術名額之一就是圖像資料脫敏的速度,即脫敏算法每秒能夠處理多少幀的圖像資料,而它主要取決于圖像識别算法能力和硬體性能的使用率。

李鵬說:“針對不同SoC晶片的特性,公司通過利用硬體性能的資源,尤其在一些不包含NPU和GPU的SoC晶片平台下,基本能保證在一個A53的核上做到每秒25幀的圖像資料脫敏速度,能夠滿足行車記錄儀和其他裝置的實時脫敏需求。”

那麼,每秒25幀的圖像資料脫敏速度具體是一個什麼樣的行業水準?

李鵬繼續說:“每秒25幀的脫敏速度屬于行業内較為領先的水準,基本能保障客戶在查閱手機視訊流時,圖像資料不存在掉幀或者卡頓的體驗。雖然目前公司的脫敏速度能夠實作大于這個數值,但使用者的體驗感上也不會存在差異化,不過,低于這個數值的話,使用者就會遇到一些閱覽的不流暢感。”

4.3.2 商務資源

對于一個新業務來說,前期若要推廣進市場,需要很強的銷售支援的。既然源駛科技主要是以研發為主,而市場和銷售方面的人員卻不多,這是否會影響公司的市場開發?

周翔說:“在源駛科技成立之初,背後的兩大股東就已經帶入了一些商務資源。其中,MINIEYE會帶入已合作過的主機廠資源以及一些長期合作的供應商資源;而華設集團會将智慧停車和車路協同相關業務都導入到源駛科技,這兩塊業務需要在路端布置相機,未來路端的圖像資料可能也會具備脫敏的需求。”

4.3.3 政策了解能力

最後,在與源駛科技兩位管理者的交流過程中,筆者深感到該公司對于政策動向的高度關注以及政策的解讀非常深,這也會幫助公司在未來産品戰略布局上,形成一定的預見性,有利于公司更快地打開市場。

一方面,源駛科技方面提到,公司參與編著了《方法》;另一方面,公司CEO周翔先生是中國汽車協會的大資料中心的特聘專家,曾多次參與國内多個資料安全相關的規範制定讨論。

五、未盡之語

人臉和車牌的圖像脫敏隻是一小步,未來在智能汽車領域内,圖像敏感資料的定義範圍或許還會繼續擴大。

周翔說:“資料安全方面的監管或許會更加嚴厲,對于圖像資料的采集内容,可能會不僅限于人臉和車牌,還會有一些環境資料,比如路端攝像頭資料的脫敏。”

參考歐盟在2016年頒布的GDPR《通用資料保護條例》來看,李鵬說:“這是一個涵蓋多種資料的條例,條例指出對于能夠用于生成使用者畫像的資訊,甚至标示牌、門店和商标等資訊都會有一定的保護機制,相比于國内現行的規章制度來說,該條例要更加嚴厲。”

“再者,個人資料需要具備使用、銷毀、儲存等各個方面的權利,但目前在國内做得并不理想,主機廠仍需要以類似書面的形式給使用者提供一種選項,比如是否授權主機廠使用某些資訊,并且在協定内需要明确列明資料的采集與使用方式、資料的具體用途、協定解約的方式等關鍵資訊。行業和監管部門需要一同找到資料安全和自動駕駛發展的平衡點,才能穩步推動科技的進步。”周翔提到。

未來,圖像資料脫敏相關政策會往什麼方向再細化?或許不久的将來,我們可以拭目以待。

繼續閱讀