天天看點

分析720萬條疫情資訊後,阿裡張子柯首次将輿情資料引入傳染病模型

傅裡葉說,數學主要的目标是公衆利益和自然現象的解釋,顯然,在這次疫情中,這兩個目标得到了統一。

自從一月份疫情初期開始,文摘就報道了來自《柳葉刀》、《自然》等期刊和帝國理工學院、CDC等學校和機構提出的各種數學模型。

模型是現實的模拟,但是單一的模型不能解釋複雜的世界,就像斯科特•佩奇在《模型思維》一書中展現的核心思想—— “多模型範式”,他認為關鍵不止是找到一組相關統計工具并且反複使用它們,而是通過從幾個模型對事物進行模組化來測試我們對事物的了解。

這項工作不止是大學和研究機構在做,科技公司也在依托自己特有的視角來審視這場疫情,阿裡巴巴商學院複雜科學研究中心的張子柯教授及其合作者就發現,在新型冠狀病毒疫情不斷發展的同時,資訊擴散的規模和速度也在增大,顯然,輿情和疫情之間有着明顯的相關性。

在進一步的研究中,張子柯教授和合作者通過輿情和疫情的相關資料建立了“基于資訊擴散的新型肺炎網絡傳播模型”,試圖從輿情的角度去了解疫情。文摘也在第一時間就這一研究成果對張子柯教授進行了采訪。

從微觀尺度去觀察和監督疫情,輿情是“感覺社會的顯微鏡”

為什麼說輿情可以反映疫情的發展?

張子柯教授和其合作者分析了網上與本次疫情相關的全媒體資訊,來源涵蓋了2020年1月1日-31日期間來自新聞媒體報道、微網誌、微信公衆号、論壇、各大用戶端等媒體共計720多萬條資訊,并對比了同期的疫情發展态勢。

輿情資訊與疫情發展二者之間,有着明顯的相關性,這預示着通過網絡輿情資訊來研究疫情發展态勢是可行的。

我們也可以看到,從1月20日開始,疫情進入了爆發期,也是在這一天,國家衛健委進階别專家組組長鐘南山院士在接受央視連線時明确表示,此次新型冠狀病毒感染的肺炎,存在人傳人的現象。

同日,國務院總理李克強1月20日主持召開國務院常務會議,要求武漢市要嚴格落實防控措施,把好相關市場關閉、野生動物管控和機場、車站、碼頭等體溫篩檢關口。

問題的嚴重性也引發了網絡上的強烈反響,關于疫情的輿情資訊也在這個時候進入了爆發期,人們對這次疫情的重視程度在短時間内就産生了質的變化,正如張子柯教授在采訪中所說,“這種高度關注度反過來又會影響到人們采取自我保護措施的意識強弱。是以,運用輿情和疫情所呈現的相關性展開研究,正是大資料思維研究的展現。”

為何湖北作為疫情爆發中心,輿情數量卻不是最高?

一般而言,如果傳染數量增加和傳染範圍擴大,預示着疫情發展越來越糟糕。相應的輿情數量會更多,也多表現為悲觀情緒。反之,随着疫情減少,相關輿情數量也會逐減少,也會逐漸更多地表現為樂觀情緒。

張子柯教授表示,“從輿情資訊的數量和内容兩方面着手進行觀察,如果我們能設計一套能夠反映真實情況的輿情的系統,是可以一定程度上從微觀尺度去觀察和監督疫情的發展态勢。”

根據團隊繪制的新型肺炎疫情和網絡資訊輿情的地理分布,可以看出,總體而言,這兩者之間存在一定的相關性。同時也可以看出,輿情資訊最多的地方其實并不是疫情最嚴重的地方,而是北京市、上海市和廣東省這樣的一線省市。

針對這一情況,張子柯解釋說,原因可能很複雜,一是在疫情非常嚴重的地方,人們可能更加關注身邊疫情的發展和防治措施;二是也與當地的網絡媒體發展程度有關。

我們應該都記得,在疫情進入爆發期之後,武漢多個醫院的醫務工作者曾在網上物資求助資訊,可以想見的是,這些醫務工作者在發完求助帖之後,轉身就去關注病人了,這時候全國各地會争相轉發響應,導緻輿情資訊的擴散效應。

張子柯教授表示,“從這個意義上來說, 更能展現輿情和疫情的相關性和互相作用。”

建立輿情-疫情的模型,既可幫助了解疫情,也能指導疫情防控

輿情和疫情在時空關系和數量上的相關性給了張子柯教授兩點啟發。

  • 網絡輿情資訊可以一定程度上反映疫情發展的态勢;
  • (正面)輿情資訊有助于幫助人們了解新型肺炎,并積極做好防範措施。

此外,鑒于一個感染者不太可能接觸到所有其他人員(即有限接觸範圍),是以在人群建構上選用了傳統網絡模型——BA網絡(即無标度網絡)。基于以上幾點,張子柯教授建構了基于資訊擴散的新冠肺炎傳播的SEIR模型。

β : 易感者被感染的機率;η :  潛伏期的個體轉化為感染者的機率;μ : 感染者恢複機率;γ : 有意識的易感者感染機率減少因子;γ₁ : 有意識的感染者感染别人機率有效因子;γ₂ : 有意識的潛伏者感染别人機率有效因子;γ₃ : 無意識的潛伏着感染别人機率有效因子;α : 新型肺炎相關資訊傳播率;N:網絡規模總數(即人數);( bij )NxN:資訊傳播層網絡鄰接矩陣;( bij )NxN:疾病傳播層網絡鄰接矩陣;S:健康人群;E:處于潛伏期的感染人群;I:感染人群;R:恢複人群

其中,處于潛伏期的人群也有感染易感者的風險。伴随着肺炎病毒的傳播,相關資訊也會在人群中傳播開來,是以,又将人群分為有疾病意識的人群(A)和無疾病意識的人群(U)。無意識的人群會通過網絡媒介或口口相傳得知疫情資訊,進而成為有意識的人群。有意識的易感者(SA)會通過減少出行、戴口罩、自我隔離、以及洗手消毒等行為減少被感染的風險。同時有意識的感染者(IA)會被隔離起來,其感染人群的機率也會相應減少。

通過計算該模型(具體過程略),可以得出疫情爆發時的有效感染門檻值 β c/μ (注:當疾病傳播的有效傳播率達到或者大于該值時,疾病會在網絡上持續傳播并發生爆發,反之則不會傳播且逐漸消亡)可以轉化為計算矩陣 H=[1-(1-γ)piA ]bji 的特征值問題,

結果顯示,公衆自我保護意識越強烈,疫情越難爆發。同時,模型結果也表明:疫情爆發門檻值和人群規模相關。是以,除了加大資訊公開和宣傳力度外,将大規模人群分區塊隔離,也可以有效降低疫情爆發的機率。

将輿情資料引入R0,在疫情防控中提升輿情導向效力

根據基本再生數R0的定義,張子柯教授及其合作者進一步得到基本再生數R0(注:R0 可以簡單地認為是一個傳染者其平均患病期内可是以傳染的人數)為:

如果以R0=1為臨界點,結果表明,在人口數為千萬級的城市中,如果自我保護意識機率達到在0.5以上,同時疫情關注度在0.9以上時;或者自我保護意識機率在0.75以上,同時疫情關注度在0.7以上,疫情将極有可能被抑制,不再蔓延。

從之前文摘報道中可以看到,不同的模型得出的R0資料不盡相同,但是首次将輿情資料納入R0的估計,其目的也是從輿情的角度給出建議,指導正面輿論的産出。

張子柯教授在采訪中表示,“希望通過網際網路手段,讓自我保護意識深入人心,進而病毒通過人際接觸進行傳染的機會,降低R0,最終緩解疫情。”

盡管這是首個結合輿情資料的疫情傳播模型,張子柯教授認為後期還有很多工作要做。比如“後面還需要考慮到輿情對人口流動、出行行為、返工等因素的影響,從時間和空間兩個次元同時考慮輿情與疫情的互相耦合作用關系。 ”

考慮到流行病傳染主要在于人類本身的不衛生和不文明行為,張子柯教授認為這個模型給未來我國疫情防控措施的啟示意義在于:“通過對疫情正向的輿論引導,如果能将大衆的自我保護意識轉換為一個常态化的防控行為,人們對戴口罩、勤洗手、常備消毒液、拒絕吃野生動物等行為有了普遍的認同,就可以從源頭上杜絕大部分傳染性疾病的大規模擴散。”

最後一點小福利,文章中提到的斯科特•佩奇的《模型思維》一書,由湛廬文化出版譯本,在文章中留言獲得點贊最多的兩位讀者将獲贈該書一本,大家踴躍留言噢!

繼續閱讀