天天看點

數智洞察丨一文帶你了解健康碼背後的故事

來源 | 阿裡雲研究
數智洞察丨一文帶你了解健康碼背後的故事

編者按:

春運将至,歸心似箭的同時,保護好自己的健康和安全,才是對家人最大的負責。

在這個“綠碼走遍天下,紅碼寸步難行”的時期,每個人聽到最多的問候就是:請出示一下健康碼!

今天,我們就來聊一聊這個碼,它從哪兒來,又有什麼奧秘。

數智洞察丨一文帶你了解健康碼背後的故事

導語

抗擊疫情,既是一場醫療戰“疫”,也是一場數字化戰“疫”。數字中國的防疫地圖正以網際網路的速度推進,這其中的典型代表就是支付寶健康碼。

2月11日杭州上線,一周落地超過百城。随後四川、浙江、海南實作全省覆寫,健康碼成為各地數字化防疫标配。

近日,國家發改委聯合多部門釋出關于做好2021年春運工作和加強春運疫情防控的意見,指出加快推動“健康碼”全國一碼通行,提高人員通行效率。

健康碼從哪兒來,又有什麼奧秘?本文帶你深入了解。

數智洞察丨一文帶你了解健康碼背後的故事

從人防到“碼上”防疫

疫情防控,關鍵是人的防控。

健康碼推出之前,全國各地的防疫關卡都是靠“人肉”登記,紙路條是一個個孤島,且隻能證明你此時此刻的狀态。

健康碼以真實資料為基礎,市民或者返工返崗人員通過自行網上申報,經背景稽核後,即可生成屬于個人的二維碼。這張碼是動态的,随着使用者每天的狀況送出,所處區域的變化、健康狀況等因素,會發生相應的變化。

數智洞察丨一文帶你了解健康碼背後的故事

紅、黃、綠三色的健康碼,從2月9日在杭州餘杭區率先推出,之後杭州全市推廣,浙江11地市全部上線,到2月16日,國務院辦公廳電子政務辦指導支付寶加速研發全國統一的疫情防控健康資訊碼,隻用了7天時間。

截至2月18日,領取浙江省健康碼的人數已經高達1500萬。四川、海南、重慶……健康碼幾乎以一天一個省的速度在落地,在全國24個省200多座城市散開,一張數字化防疫的“天網”以中國速度全面鋪開。

依靠數字化的辦法,讓因為疫情“關”上門的每一個人,不再是一座座資訊孤島,城市運作管理也擁有了可靠有力的資料支撐。

從無到有,健康碼的誕生

民警中的産品經理

2月4号,餘杭開會明确提出要建議一套數字化方案,并且要做到三個全:“全人群覆寫+全流程掌辦+全領域聯防”。

2月5号淩晨5點,第一個版本誕生了,之後就開始了每半小時一疊代的優化過程。餘杭區的這套經驗也很快被杭州市采納,餘杭健康碼推行不到24小時後,支付寶端上線了杭州健康碼。

2月6日,還在杭州市警察局防疫專班奮戰的鐘毅接到了市局緊急召集令——研發建設“杭州健康碼”,鐘毅不負責程式設計,但是需要統籌産品,相當于“産品經理”。

因為是一個全新的構想,“杭州健康碼”沒有樣本可以參照,從色彩搭配到圖形調整、從空間布局到文案設計,每一個細節都需要鐘毅和團隊反複斟酌和确定。

數智洞察丨一文帶你了解健康碼背後的故事

圖檔來源:杭州公安微網誌

2月11日下午,杭州健康碼正式上線,向全杭州市民開放注冊。首日申請量突破130萬,短短上線4天,群衆電話投訴件超過5000起,網絡等各個管道的咨詢件更是達到了驚人的10萬件。40天内, 29輪次技術調整,14個版本的規則完善,63項功能應用的疊代,資料擷取效率較上線初提升9倍,杭州健康碼的正确率達到99.99%以上,成為杭州數字防疫、數字治理的一張閃亮名片,也迅速複制推廣到全國18個省200多個城市。

被國博收藏的代碼

7月14日,阿裡雲研發的全國健康碼引擎第一行代碼,被國家博物館收藏。這是國博曆史上首次收藏代碼。

數智洞察丨一文帶你了解健康碼背後的故事

這個小小的碼,背後是一個需要複雜協同的浩大工程:涉及的崗位有技術、産品、BD、法務、客服……并肩作戰的團隊還有釘釘、阿裡雲。

還有來自全國各地地方政府的來電。2月11日杭州全市推廣支付寶健康碼後,越來越多省市聯系過來,開發時間不斷縮短,從正常的4周壓縮到4天,到一天,再到以小時計。

支付寶和餘杭ISV上線餘杭版健康碼,4天;釘釘和阿裡雲團隊上線杭州市健康碼,1天;支付寶上線浙江省、四川省健康碼,3天;兩省上線時間間隔,16.5小時……

2020年2月13日,阿裡雲資料智能團隊寫下了這行代碼,軍令狀立下——48小時内浙江全省上線健康碼。

2月14日晚上8點,大家正在緊張測試浙江省健康碼,突然同步過來一個資訊:大家準備好四川健康碼上線,上線時間:明早10點。

2月15日,四川健康碼順利上線,随即接到通知:大家準備一下,上線全國版健康碼。

全國複工在即,阿裡雲技術團隊把自己變成了“火神山”。

健康碼的奧秘

健康碼的運作原理

健康碼最主要的是基于手機号碼的手機定位,基于身份證号碼下的消費記錄、乘車及飛機記錄,及填報行程資訊或者掃描場景位置登記等,結合疫情進行大資料分析後的結果展示。

各種健康碼基本都是對接的 “通信大資料行程卡”,它不受地域限制,不收集身份證号、家庭住址。隻要對接輸入手機号碼,就能基于通信網絡資料擷取過往14天内的出行資訊。原理就是基于手機信令資料能夠有效定位使用者的手機位置,進而尋找到機主本人。

健康碼的資料來自于大資料,舉個簡單的例子,過往7-14天的GPS位置、線下掃碼商家位置、購買火車票的資訊等等,如果你買了一張正處于疫情嚴重城市地區的火車票,健康碼很可能就會變色。

數智洞察丨一文帶你了解健康碼背後的故事

手機定位三大原理

說到這,有人可能會問,那如果我把手機關掉并拔出SIM卡,大資料排查時相關從業人員還能找到我嗎?

要回答這個問題,應先知道手機定位的工作原理。一般而言,手機主要通過以下三種方式進行定位:

1. 基站定位

移動通信網絡由許多按照一定規則布局的基站構成,每個基站不僅具體位置不變,且有固定編号。手機開啟後會自動搜尋周邊基站,并選取信号最優的接入。

與此同時,手機還會随着位置變換自動切換基站。是以,通過各個基站檢測接收到的信号參數,如信号到達時間(時間差)、信号達到方位角、到達信号的強度,就能确定手機的位置。

基站數量遠少于WIFI,且基站都有公開的位置資料,是以采集工作相對簡單。

數智洞察丨一文帶你了解健康碼背後的故事

2. 衛星定位

衛星在太空不停向地面發射導航電文信号,等于實時标注自身位置。一旦手機接收到多顆衛星信号,就可以通過手機與每顆衛星的距離、角度等進而推算出手機的位置。

衛星定位系統的優點在于精度高,誤差一般在15米以内。GPS晶片會接收天空中多顆衛星的同步信号,然後根據信号的相位差,計算出具體的經緯度。保持多顆衛星信号同步,将誤差控制在納秒級以下,是GPS核心技術之一。

數智洞察丨一文帶你了解健康碼背後的故事

3. Wi-Fi定位

每個Wi-Fi路由器都有全球唯一的MAC位址(包括啟動移動熱點功能的手機),且會不停發射SSID廣播。如果我們的手機開啟無線功能,Wi-Fi天線就會時刻偵測周圍的無線熱點功率和MAC位址,并将其提供給專門的位置服務商。一般情況下,使用者周邊會有多個WIFI信号源,此時手機會默默地解析出所有WIFI的MAC位址,如果某些WIFI的資訊在資料庫中已經存在,則可以根據信号強度,推導出未知WIFI的經緯度。如果沒有已知WIFI,而手機碰巧開着GPS,則也能完成資料采集。這樣,服務商就能擷取個人的具體定位。

WIFI方式和基站方式,都需要聯網,要不你怎麼和伺服器聯系?但是WIFI子產品打開後,即可進行WIFI掃描和資訊采集,不必連接配接到某一AP上,基站也是一樣,不必打開蜂窩網絡。因為向伺服器發起查詢請求,既可走蜂窩資料流量,也可走WIFI流量。

數智洞察丨一文帶你了解健康碼背後的故事

是以,關機、拔卡不影響手機定位。單純拔掉SIM卡就像是“掩耳盜鈴”。因為手機隻要開機就會嘗試接入基站,而基站一旦識别到手機,即使沒有SIM卡,也可以通過手機唯一的識别碼IMEI号關聯其相關資訊。

需要說明的是,個人所處的位置、行蹤記錄等屬于進階别的個人隐私資訊,它們平時作為加密資料,無法被普通人盜用。即便是營運商的從業人員,沒有國家機關的授權也不能輕易利用這類資訊。

健康碼的技術原理

1. 資料源

“健康碼”的生成包含了個人基礎資訊,例如人臉識别,同時結合了公安、移動營運商、衛健委、高鐵、機場、高速公路道口等資訊,由于此次公共衛生事件涉及10多億人,而且每個人每天都會産生新的生活軌迹,是以在大資料時代,面對各種各樣的資料“洪流”,如果希望從中提取出有效資訊,就如同在高壓水槍下喝一口水一樣困難。這樣就凸顯了大資料技術的重要性。

數智洞察丨一文帶你了解健康碼背後的故事

2. 狀态機

健康碼有三種顔色,大部分人的碼是綠色的,代表健康,一旦發現有相關人員感染确診,在指定時間和感染者有接觸的相關人員也必須進入自我隔離狀态,從碼的角度來說會變成黃色。

這種資料的擷取和處理不是傳統的靜态資料的篩查,而是實時的動态資料的比對和監控,使用非大資料技術想完成這個功能,基本是天方夜譚。

首先,從采集的角度來看,此次健康碼的資料源不是靜态資料源,而是動态資料源。

如果說雙十一隻是每年一次的平台壓力測試,那麼健康碼則是每天都是平台的壓力大考,利用資料接入層的負載均衡接入能力,背景每天都會産生數以億計的資料量。

其次,從存儲角度來看,利用大資料技術的海量存儲功能,接近PB級别資料存儲和擴容的能力,這也是傳統技術無法做到的。

數智洞察丨一文帶你了解健康碼背後的故事

3. 資料整合

其三,也是重中之重,僅僅把資料存儲下來可不能解決健康碼要解決的問題,關鍵是要資料分析和資料整合。

是以利用大資料技術中最重要的ETL和流處理能力,不管是采用Spark架構的記憶體計算模型還是利用Flink的流處理模式,集合上千台伺服器的計算能力,讓我們的資料進行實時的比對,實時的處理成為了可能。

結語

數字化戰疫是一場無聲的戰争,也是全民參與的戰争,支付寶健康碼的誕生,實則是數字中國建設的一個縮影,面對突發事件的應急關聯、全民動員,将産生長遠的影響。

相信,當全國皆“綠”,便是數字化戰“疫”春暖花開之時。

繼續閱讀