大資料是“靈丹妙藥”嗎?
撰文 | 迷走小蜜蜂
來源 | “醫學界”公衆号
2020年3月1日,美國紐約州報告首例新冠病毒感染者。
19天後,紐約州州長安德魯·科莫頒布全州範圍内的“居家令”。
作為紐約州的“心髒”,紐約市開始采取居家辦公、街區封鎖和大規模檢測等防疫措施。人們被要求保持2米社交距離。藥店自制“防護網”,以期保護從業人員、隔離潛在患者。

圖檔說明:2020年3月,美國紐約市皇後區一家藥店内,從業人員透過防護塑膠膜,售賣藥品。/News UN
但這些舉措收效甚微。到當年4月,紐約市疫情大暴發,日均死亡數近千,殡葬量暴漲6倍。
紐約市政府動員300多輛冷藏貨櫃車。車上載的都是新冠逝者屍體。很快,冷櫃車不敷使用。法醫處規定,屍體冷藏期限為14天。過期無人認領,就将送往哈特島公墓埋葬——媒體形容為“萬人冢”。
圖檔來源于AP
流行病學家Sharon Greene的辦公室,就在紐約市皇後區的一棟高層建築内。
她在辦公室裡,一邊看着新冠肺炎席卷紐約市,一邊和團隊攜手、研發名為SaTScan的開源程式。
通過這一程式,研究團隊繪制出“紐約新冠病毒傳播實時地圖”。“我們借助來自醫院和實驗室的詳細資料,發現病毒在不同區域的影響不同。”
結合地圖,Sharon Greene等人可以調停資源,投入到最需要的地方。比如,讓新冠肺炎檢測車停在短時内最具暴發隐患的街區;指導政府把口罩、手套等防疫物資,先分給受疫影響最嚴重的機構。
随着疫情蔓延,Sharon Greene開始關注“傳播增長速度”,預測“哪些地方可能出現病例快速增長”。
“我們很難實時轉移資源。”Sharon Greene說,“但如果能更早地提醒群眾、避開高風險區,他們就有更多機會保護自己、避免感染。”
以Sharon Greene為代表的現代流行病學家認為,這種以資訊技術為核心、極具針對性的方法,是公共衛生的“新興武器”,有助于實作“精準公共衛生”(precision public health)。
圖檔說明:在美國紐約曼哈頓街頭,一名男子正在接受新冠病毒檢測。/The New York Times
源起:對精準醫學的補充
2013年,西澳洲州衛生部公共衛生主任Tarun Weeramanthri院士率先提出“精準公共衛生”,稱這是對精準醫學的補充。
“精準醫學”是根據個體不同的基因、代謝狀況、生活方式和所處環境,來量身定制合适的醫療方案。其成本較高,目前階段大部分人無法受益。
“精确公共衛生”的定義廣泛而多變。一般來說,它是指以人群為中心,通過基因組學、生物資訊技術,與大資料、人工智能(AI)等工具交叉應用,定義人群的疾病發生風險,确定可行的幹預措施,進而精準預測和預防疾病的發生發展,促進人群健康。
理論上,二者互為補充、互相促進。一個以個體治療為中心,一個重在廣泛預防。
發展:由來已久日趨成熟
在哈佛大學陳曾熙公共衛生學院生物統計學家John Quackenbush看來,流行病學的誕生、發展,就是為了“精準公共衛生”。
19世紀50年代,英國倫敦暴發霍亂。John Snow醫生挨家挨戶探訪,在地圖上标出所有霍亂确診病例。他發現,在布羅德街水泵處取水的群眾,其感染率更高。
此後,倫敦、紐約等大城市成立市政公共衛生部門,幹的第一件事就是淨化飲用水、建立污水處理系統、清除垃圾,以及收集出生和死亡資訊。其意義是廣泛的,大多數人都能從這些幹預措施中受益。
John Snow醫生的嘗試,被視為“大資料分析”的雛形。
“Snow醫生的統計辦法淳樸,略顯笨拙。但在1854年,這是最先進的理念。如果那時Snow醫生能使用SaTScan,他也許能更快地阻止霍亂。”John Quackenbush說。
圖檔說明:1854年倫敦暴發霍亂。John Snow醫生繪制地圖、精确追蹤霍亂病例。/On the mode of Communication of Cholera
《自然》撰文指出,随着時間推移,醫學科學界了解到更多疾病知識,流行病學變得複雜,涉及知識、資料衆多,對“精準”的要求也相應提高。
Muin Khoury是美國疾病控制與預防中心基因組學和精準公共衛生辦公室主任。作為一名兒科醫生和遺傳學家,多年來,他一直在研究家族性高膽固醇血症(FH)。
這是一種遺傳疾病,人群發生率約為1%。患者會出現膽固醇水準飙升,或誘發心髒病和卒中等。若能及早确診、正确治療,能降低約80%的心血管病風險。
但公共衛生資源有限,對每個人進行篩查是不切實際的,還易造成資源浪費。
目前,有一支美國團隊正在研究AI,試圖通過掃描健康記錄等大資料(包括血液膽固醇值),識别潛在的FH患者。這樣更具針對性,還能節省資金、挽救更多生命。
南卡羅來納醫科大學流行病學家Caitlin Allen也在測試AI。她最近完成一項研究,發現分析醫療網站的聊天機器人資訊,可以預測一個人是否需要進行多癌症基因檢測。
“這是精準公共衛生的表現之一。它還以多種其他形式,展現在群眾面前。”《自然》稱。
2016年,寨卡病毒橫掃西半球。當年9月1日,在美國出現本土傳播的寨卡疫情1個多月後,佛羅裡達州邁阿密市檢出本土蚊感染寨卡病毒。
随後,當地衛生官員利用地理資訊系統,繪制出“蚊蟲地圖”。最終,他們選擇隻在兩個街區噴灑殺蟲劑——而不是整個城市,以阻斷帶毒蚊蟲侵入。
圖檔說明:2016年,美國佛羅裡達州邁阿密,一名衛生官員在目标社群噴灑殺蟲劑,以殺死蚊子、阻止寨卡病毒傳播。/Getty
基于大資料的“精準公共衛生”也展現在不少公益項目中。
為幫助政府、慈善機構等制定有依據的公共衛生政策,比爾和梅琳達·蓋茨基金會撥出總計2.71億美元的資金,以繪制地圖、标記亞非孕産婦健康問題和兒童營養不良高發區。
在新冠大流行期間,洛克菲勒基金會收集防疫政策,建立“人工智能”,幫助教育行業規劃時間表,決策如何讓學生們安全返校。
在實時追蹤新冠病毒方面,“精準公共衛生”也在發揮影響。
“我們對傳染性病原體的基因組進行測序,形成幾個資料庫。病毒學家們不僅能第一時間觀察到變異株,還能解開它們在人際傳播時的細微變化,以此來判定是誰感染誰。”英國格拉斯哥大學病毒學家Emma Thomson說。
沖突:該“精準”還是該“公共”?
随着“精準公共衛生”的推廣應用,倡導者們也開始擔憂其存在不足。
美國波士頓大學公共衛生學院院長、流行病學家Sandro Galea認為,“精确公共衛生”的首要問題,在于其定義不明,過分依賴高精尖技術。
“我們了解流行病學家和其他專業人士,要使用時髦的術語、獲得資金支援。但過度精準或使其偏離本質,導緻很多人無法擁有最基礎的公共衛生服務。”Sandro Galea表示擔憂。
英國利物浦大學的David Taylor Robinson稱,過度追求“精準”,可能使人們忽視技術含量較低但更具挑戰性的健康幹預政策,比如全民醫療保健、減少收入不平等。“我們可能會被資料蒙蔽,鑽了牛角尖。”
澳洲墨爾本大學公共衛生研究員Angeline Ferdinand指出,有些地區連基本的出生、死亡資訊都收不全,更不用奢望它能進行全基因組測序了。“太精準了,反而會加劇國家内部和國家之間的不平等。”
“新冠大流行後,資訊技術公司承諾,會和公共衛生研究人員分享隐私資料,幫助後者挖掘、分析資料,找到攻克新冠傳播的方法。兩年過去了,很明顯大資料并不是靈丹妙藥。”美國醫學新聞網站STAT指出。
哈佛大學陳曾熙公共衛生學院傳染病動力學中心Nishant Kishore一直在配合衛生主管部門,調查病毒傳播情況、修訂防疫政策。他表示,獲得資料是有用的,但“不幸的是,資料從生成到解析,都是為了商業目标,而不是公共衛生。我檢視谷歌,它告訴我更多人在疫情暴發期間待在家裡,而臉書說其特定時間打開率下降,是以意味着待在家裡的人少了。作為一名研究人員,我該相信誰?”
參考文獻:
[1]楊瑛瑩,傅傳喜.精準公共衛生研究進展及挑戰.中國公共衛生,2021,37(2):371-374.
[3]Why big data didn’t deliver on its big promises to combat Covid-19.STAT
來源:醫學界
責編:萬順順
校對:臧恒佳
制版:薛嬌