抗擊疫情的關鍵是切斷傳染,這中間,各地最困擾的問題就是網民反複講的“如何找到‘B’類人群”。這些與感染人群或來自疫情重大地區人群(被稱為A類人群)在未知公共場所産生過某種交集的人,需要盡快采取隔離措施。
找到B類人群正常的做法有兩種:一是詢問“A”類,通過他們的陳述來尋找。這種方式不僅時間長效率低,而且可能因為記憶疏漏或者故意隐瞞而導緻嚴重遺漏。另一種是公布病例的軌迹,讓公衆自行查找自己是否有可能成為密切接觸者。這種方法也無法保證效果,畢竟有人不會查,查了即使是密接者,也會有人不主動申請隔離,進而留下巨大的傳染隐患。
在正常方法存有隐患,疫情又十萬火急的情況下,許多大資料建設比較完善的城市和地區,不約而同地選擇了大資料分析作為找到“B”類人群的核心工具。原因很簡單,所有的“B”都是因為與“A”有時空上的交叉才出現的,而這些交叉,當彙集到越來越多的城市管理資料時,就表現為資料的交集。比如,交通部門資料中出現在同一個航班、同一個高鐵車廂的乘客、或者是醫療系統中登記的統一時段内就診者、在藥店購買發燒藥的來自重點疫情地區的人…
“通過智慧城市大資料已有的資料,再接入公安、民政局、住建部、社保、衛健委等資訊,通過資料分析模型,我們能在半小時裡,幫助相關疫情分析人員計算出相關疑似病人名單,并推送給一線防疫人員。相比之下,沒有這套系統的地方,僅依靠人工用Excel拉資料計算,可能就需要2-3天時間。”北京海緻網聚資訊技術有限公司(下稱“海緻”)總裁楊娟在接受澎湃新聞專訪時稱。
自1月21日開始,海緻協助各地相關部門通過海緻的大資料挖掘系統,每天處理相關資料幾十億條,每天發出幾萬條關于“B類人群”的資訊,為社群工作者的精準排查提供支撐。海緻成立于2013年,專注于智慧城市、安防和智能金融等大資料分析領域。目前已與80多個地市展開了大資料應用的深度合作。
用大資料分析快速找到“B”
既然“B”類人群是因為與“A”類人群有時空交叉才出現的,那麼就需要确定A和B是在哪個地點、哪個時間段、做了什麼。也就是我們寫作文時,所需要的人、地、事、物。
在發生疫情前,多地城市的大資料建設,已經彙聚了海量的人口、鐵路航班、城市交通等資料,這些資料成為了尋找“B”類人群的大資料基礎。隻要将衛生部門的“A”類人群資料接入,再對接一部分衛生、基層社群組織的資料和網際網路資料,通過大資料分析和計算,就能高效地找到B類人群畫像。
據楊娟介紹,包括武漢在内,這次很多城市抗擊疫情的大資料分析挖掘都以海緻資料中台以及知識圖譜為重要依托。在這個中台裡,除了有基礎的城市大資料外,還能對接城市衛健、交通、基層社群組織資料。
“在我們這個平台裡,我們大概融合了上百類資料,疫情出來後,我們迅速搭建了66種,2000多個模型,涉及到關注人員、交通管理、隔離監管、醫療收治、輿情分析、治安警情、返程複工等一系列圍繞抗擊疫情社會面的态勢感覺模型。這麼多的資料經過分析和計算,定期重新整理,然後推送到一線防疫從業人員手中。同時,我們設定了一個自動回報和修正的機制,這個平台會根據外界的回報和輸入,不斷優化模型,讓資料推送的精準程度不斷上升。”楊娟說。
舉個例子,在多地迎來複工複産潮後,一旦有人(也就是“A”)被确診。這套系統能馬上派上用場。首先,可以通過城市大資料中的人口資料,找到這位家庭成員,然後通過社保資料,找到就業機關;再通過交通資料,查找搭乘同一班飛機或同一趟高鐵的同行者;通過這樣的多元度的篩查,這套系統能在30分鐘内計算出與A有密切接觸的人員,并把分析結果分發到一線防疫人員手中。
這樣一來,可以快速批量找到“B”類人群的相關身份資訊,不僅提高了疫情防控效率,也減少了人為的瞞報、漏報的情況。
大資料還能做些什麼
據楊娟介紹,目前,全國許多地方已經基本形成了以“人口、房屋、行業場所、交通、網際網路”等資料為主,以“金融、民政、教育、醫療、工商、稅務、市政、能源”等政府部門共享資料為輔的完整資料體系。在應用層面,也基本實作了基于物聯感覺、地理資訊、大資料和人工智能技術的“綜合态勢感覺、對象監測預警、群體關系挖掘、網際網路輿情監測”等實戰應用手段。
在疫情出現前,多地的城市大資料就已經在其他多個領域裡發揮作用。“比如公共安全事件、重大生産事故、自然災害,以及金融群體性事件等。”楊娟說。
例如:在金融事件中,一旦有人主動舉報,觸發某人或者某個公司可能存在非法集資,或者吸納大額公衆存款等情況。相關部門就能根據舉報,拉通各類資料來做關聯分析。
“利用人口資訊、經濟活動資料、稅務資料、社保資料,可以做關聯分析,來看這家公司是不是已經構成了非法集資的情況,資料分析可以做個預判。”楊娟告訴澎湃新聞。
而利用大資料分析結果,去抓捕逃犯,尋找潛在恐怖分子的案例,已經不算新鮮。尤其是在網際網路、大資料、人臉識别等技術的聯合助力下,國内警方曾陸續破獲幾年前、十幾年前,甚至是幾十年前的衆多懸疑案件,例如近期轟動一時的勞榮枝案件。
疫情下,大資料應用帶來的三點思考
既然依托城市大資料建立的資料分析能力如此有效,未來是不是可以建立一種預警模型,一旦資料在某些領域裡發生了變化,系統就能自動報警,進而起到公共衛生應急事件的作用?
“如果我們能夠把資料更好的利用起來,至少能讓我們相關部門在進行一個決策和判斷的時候,能夠做到有據可依,而不是完全憑經驗和直覺。但是最終的決策并不是由資料來做出的,資料隻是一個輔助決策的作用。”楊娟說。
通過這次的疫情,楊娟認為,未來公安大資料想在公共衛生應急體系裡發揮更好作用,可從以下幾個方面着手。
首先,從政府角度來說,應進一步整合城市各部門各管道的資料,建設城市公共衛生應急大資料體系。“現在各個部分資料割裂,各自歸各自的情況是在改善的,比如說在很多疫情緊急的城市,其實是在比較短的時間之内,平台上就接入了像衛建委,交通和出行的資料。這次是突發事件,有點特事特辦,但未來我們希望資料能變成一個常态化的拉通。”楊娟說。另外,資料如何運轉,各個部門之間如何配合流程、完善,也需要建立相應的規章制度,把整個流程制度常态化。
其次,從大資料技術公司的角度來說,楊娟認為,除了要在平台技術層面上有更大的突破外,我們還需要去貼近政府的具體應用場景,確定資料分析模型能夠快速支撐業務需要。
第三,建設圍繞城市管理、公共安全和公共應急體系中資料采集和使用的法律體系迫在眉睫。
楊娟告訴澎湃新聞,公共危機事件發生時,公民應該義務提供哪些資料?城市各部門應該開放哪些資料?相關部門在使用這些資料時的權利和責任、時間期限和條件是什麼?這些都是在此次疫情中出現的界定不清晰的區域,直接關系到疫情的準确排查、社會的公共輿論和群眾的參與配合。是以,圍繞公共安全的資料法律體系建設,應該也是未來公共應急體系的一塊基石。
來源:澎湃新聞