大数据是“灵丹妙药”吗?
撰文 | 迷走小蜜蜂
来源 | “医学界”公众号
2020年3月1日,美国纽约州报告首例新冠病毒感染者。
19天后,纽约州州长安德鲁·科莫颁布全州范围内的“居家令”。
作为纽约州的“心脏”,纽约市开始采取居家办公、街区封锁和大规模检测等防疫措施。人们被要求保持2米社交距离。药店自制“防护网”,以期保护工作人员、隔离潜在患者。

图片说明:2020年3月,美国纽约市皇后区一家药店内,工作人员透过防护塑料膜,售卖药品。/News UN
但这些举措收效甚微。到当年4月,纽约市疫情大暴发,日均死亡数近千,殡葬量暴涨6倍。
纽约市政府动员300多辆冷藏货柜车。车上载的都是新冠逝者尸体。很快,冷柜车不敷使用。法医处规定,尸体冷藏期限为14天。过期无人认领,就将送往哈特岛公墓埋葬——媒体形容为“万人冢”。
图片来源于AP
流行病学家Sharon Greene的办公室,就在纽约市皇后区的一栋高层建筑内。
她在办公室里,一边看着新冠肺炎席卷纽约市,一边和团队携手、研发名为SaTScan的开源程序。
通过这一程序,研究团队绘制出“纽约新冠病毒传播实时地图”。“我们借助来自医院和实验室的详细数据,发现病毒在不同区域的影响不同。”
结合地图,Sharon Greene等人可以调停资源,投入到最需要的地方。比如,让新冠肺炎检测车停在短时内最具暴发隐患的街区;指导政府把口罩、手套等防疫物资,先分给受疫影响最严重的机构。
随着疫情蔓延,Sharon Greene开始关注“传播增长速度”,预测“哪些地方可能出现病例快速增长”。
“我们很难实时转移资源。”Sharon Greene说,“但如果能更早地提醒民众、避开高风险区,他们就有更多机会保护自己、避免感染。”
以Sharon Greene为代表的现代流行病学家认为,这种以信息技术为核心、极具针对性的方法,是公共卫生的“新兴武器”,有助于实现“精准公共卫生”(precision public health)。
图片说明:在美国纽约曼哈顿街头,一名男子正在接受新冠病毒检测。/The New York Times
源起:对精准医学的补充
2013年,西澳大利亚州卫生部公共卫生主任Tarun Weeramanthri院士率先提出“精准公共卫生”,称这是对精准医学的补充。
“精准医学”是根据个体不同的基因、代谢状况、生活方式和所处环境,来量身定制合适的医疗方案。其成本较高,目前阶段大部分人无法受益。
“精确公共卫生”的定义广泛而多变。一般来说,它是指以人群为中心,通过基因组学、生物信息技术,与大数据、人工智能(AI)等工具交叉应用,定义人群的疾病发生风险,确定可行的干预措施,从而精准预测和预防疾病的发生发展,促进人群健康。
理论上,二者互为补充、相互促进。一个以个体治疗为中心,一个重在广泛预防。
发展:由来已久日趋成熟
在哈佛大学陈曾熙公共卫生学院生物统计学家John Quackenbush看来,流行病学的诞生、发展,就是为了“精准公共卫生”。
19世纪50年代,英国伦敦暴发霍乱。John Snow医生挨家挨户探访,在地图上标出所有霍乱确诊病例。他发现,在布罗德街水泵处取水的民众,其感染率更高。
此后,伦敦、纽约等大城市成立市政公共卫生部门,干的第一件事就是净化饮用水、建立污水处理系统、清除垃圾,以及收集出生和死亡信息。其意义是广泛的,大多数人都能从这些干预措施中受益。
John Snow医生的尝试,被视为“大数据分析”的雏形。
“Snow医生的统计办法淳朴,略显笨拙。但在1854年,这是最先进的理念。如果那时Snow医生能使用SaTScan,他也许能更快地阻止霍乱。”John Quackenbush说。
图片说明:1854年伦敦暴发霍乱。John Snow医生绘制地图、精确追踪霍乱病例。/On the mode of Communication of Cholera
《自然》撰文指出,随着时间推移,医学科学界了解到更多疾病知识,流行病学变得复杂,涉及知识、数据众多,对“精准”的要求也相应提高。
Muin Khoury是美国疾病控制与预防中心基因组学和精准公共卫生办公室主任。作为一名儿科医生和遗传学家,多年来,他一直在研究家族性高胆固醇血症(FH)。
这是一种遗传疾病,人群发生率约为1%。患者会出现胆固醇水平飙升,或诱发心脏病和卒中等。若能及早确诊、正确治疗,能降低约80%的心血管病风险。
但公共卫生资源有限,对每个人进行筛查是不切实际的,还易造成资源浪费。
目前,有一支美国团队正在研究AI,试图通过扫描健康记录等大数据(包括血液胆固醇值),识别潜在的FH患者。这样更具针对性,还能节省资金、挽救更多生命。
南卡罗来纳医科大学流行病学家Caitlin Allen也在测试AI。她最近完成一项研究,发现分析医疗网站的聊天机器人信息,可以预测一个人是否需要进行多癌症基因检测。
“这是精准公共卫生的表现之一。它还以多种其他形式,展现在民众面前。”《自然》称。
2016年,寨卡病毒横扫西半球。当年9月1日,在美国出现本土传播的寨卡疫情1个多月后,佛罗里达州迈阿密市检出本土蚊感染寨卡病毒。
随后,当地卫生官员利用地理信息系统,绘制出“蚊虫地图”。最终,他们选择只在两个街区喷洒杀虫剂——而不是整个城市,以阻断带毒蚊虫侵入。
图片说明:2016年,美国佛罗里达州迈阿密,一名卫生官员在目标社区喷洒杀虫剂,以杀死蚊子、阻止寨卡病毒传播。/Getty
基于大数据的“精准公共卫生”也体现在不少公益项目中。
为帮助政府、慈善机构等制定有依据的公共卫生政策,比尔和梅琳达·盖茨基金会拨出总计2.71亿美元的资金,以绘制地图、标记亚非孕产妇健康问题和儿童营养不良高发区。
在新冠大流行期间,洛克菲勒基金会收集防疫策略,创建“人工智能”,帮助教育行业规划时间表,决策如何让学生们安全返校。
在实时追踪新冠病毒方面,“精准公共卫生”也在发挥影响。
“我们对传染性病原体的基因组进行测序,形成几个数据库。病毒学家们不仅能第一时间观察到变异株,还能解开它们在人际传播时的细微变化,以此来判定是谁感染谁。”英国格拉斯哥大学病毒学家Emma Thomson说。
矛盾:该“精准”还是该“公共”?
随着“精准公共卫生”的推广应用,倡导者们也开始担忧其存在不足。
美国波士顿大学公共卫生学院院长、流行病学家Sandro Galea认为,“精确公共卫生”的首要问题,在于其定义不明,过分依赖高精尖技术。
“我们理解流行病学家和其他专业人士,要使用时髦的术语、获得资金支持。但过度精准或使其偏离本质,导致很多人无法拥有最基础的公共卫生服务。”Sandro Galea表示担忧。
英国利物浦大学的David Taylor Robinson称,过度追求“精准”,可能使人们忽视技术含量较低但更具挑战性的健康干预策略,比如全民医疗保健、减少收入不平等。“我们可能会被数据蒙蔽,钻了牛角尖。”
澳大利亚墨尔本大学公共卫生研究员Angeline Ferdinand指出,有些地区连基本的出生、死亡信息都收不全,更不用奢望它能进行全基因组测序了。“太精准了,反而会加剧国家内部和国家之间的不平等。”
“新冠大流行后,信息技术公司承诺,会和公共卫生研究人员分享隐私数据,帮助后者挖掘、分析数据,找到攻克新冠传播的方法。两年过去了,很明显大数据并不是灵丹妙药。”美国医学新闻网站STAT指出。
哈佛大学陈曾熙公共卫生学院传染病动力学中心Nishant Kishore一直在配合卫生主管部门,调查病毒传播情况、修订防疫策略。他表示,获得数据是有用的,但“不幸的是,数据从生成到解析,都是为了商业目标,而不是公共卫生。我查看谷歌,它告诉我更多人在疫情暴发期间待在家里,而脸书说其特定时间打开率下降,所以意味着待在家里的人少了。作为一名研究人员,我该相信谁?”
参考文献:
[1]杨瑛莹,傅传喜.精准公共卫生研究进展及挑战.中国公共卫生,2021,37(2):371-374.
[3]Why big data didn’t deliver on its big promises to combat Covid-19.STAT
来源:医学界
责编:万顺顺
校对:臧恒佳
制版:薛娇