天天看点

健康数据、临床数据共享的难点在哪里?

国务院将“数据”列为第五大生产要素已有三年。此后,《大数据产业发展“十四五”规划》的发布、“数据二十条”的发布、国家数据局的成立,都推动了数据的市场化,甚至成为一种资产。

然而迄今为止,数据在价值创造和财富生产中的作用仍然很低,医疗保健尤其缓慢。在几年的互联互通工作中,上层建立了国家卫生平台,下层打破了部门间的孤岛效应。然而,医院之间仍然是相互独立的。科学研究和人民医疗仍然逃不出一家医院的范围。

在商业化之前,首先需要超越“分享”。在几天前的两会上,全国政协委员、中国医学科学院专家这样总结健康数据在医疗数据中面临的种种问题。

摆脱“不敢”和“不愿”,并不是一件容易的事。机构(包括药企、商业保险等非医疗机构)与机构之间的顶层设计、基础设施建设、价值测算、分配机制等。困难、流程中涉及的每一个环节都是医疗数据共享的难点。

健康数据、临床数据共享,难点在哪里:

医院的医疗数据大致可以分为五个方面:手术、临床、健康、生物和其他。DRG的实施和国家基因库的建立,有力地促进了手术、生物学数据的应用、共享乃至商业化,部分实现了一定程度的“资本化”。但健康数据、临床数据仍处于相互探索阶段的“共享”模式。

从根本上说,临床数据和健康数据涉及患者个体,数据本身结构复杂,难以标准化。因此,目前医疗保健大数据中心(北方中心)已经建成,100%的省、85%的市、69%的县建立了区域性的国家卫生信息平台,各医院也有大量不断更新的临床数据,但由于信息化建设标准不健全、数据规范和标准不一致等因素,两类数据的应用和共享还有待提高。

众所周知的“健康码”和“传染病监管”是目前比较成熟的健康数据应用,但这类应用的逻辑还停留在“统计”层面,没有对健康数据进行深入挖掘。

跨医院的临床数据共享可以有效促进制药和器械公司的研发进程。建立涵盖患者全生存周期的档案。减少因病人重复检查而造成的医疗资源和医疗保险的浪费。但要实现价值,第一步是在医院内部共享,第二步是与医院共享。

先来说说在医院里的分享。从临床医疗数据的生成到可共享的初始状态,通常需要经历一个复杂的转化过程:首先,医院需要生成终端(如CT、MR、病理)、人工录入(如既往病史、患者投诉)等渠道将生成的数据整理归类到各种数据管理系统(如PACS、HIS、PIMS)中,统一存储在机房或云端,由人工或大数据中心进行处理和管理,形成具有一定标准的数据。

在这个过程中,由于每个终端产生的数据结构不同,每个医生手动输入的数据描述各不相同,每个数据管理系统提供的数据维度不同,最终存放在机房的数据往往是多种多样的。表面上看,它可以在各种系统之间正常交互,但在使用时,要么是某些数据缺乏几个维度,要么是同一种疾病的表达存在差异,难以准确分类。目前,综合平台和大数据中心平台的介入,在一定程度上解决了数据交互的问题,但要统一HIS、PACS等管理系统的接口,将涉及大量信息技术厂商和部门的利益。同样的问题会在医院和医院层面进一步放大。为了共享,必须打破一些额外的限制。

第一是缺乏顶层设计。一方面,过去对信息系统建设没有统一的指导,每家医院的标准不同,支撑业务数字化的数据库结构不同,数据采集能力也不同。因此,即使在同一地区,三级医院、二级医院、基层医院报送的数据质量也相差很大。因此,当实施者想要收集特定的数据时,往往会发现生成这些数据的系统构造标准和数据库表结构是不同的。即使按照一个统一的标准收集,也很难解读和清理。

另一方面,各医院的收费模式也存在不一致之处。如,三级医院和大多数二级医院都是通过直接连接数据库来获取数据的,数据质量相对有保障。然而,许多基层医疗机构受到信息化能力不足的限制,往往采用手工报告。基层医疗机构医生不够,数据报告工作只能由护士或非医疗行业的人来做。这些群体填写的数据会参差不齐,这将导致同一个主体收集的数据质量有很大差异。根据“木桶效应”——将质量差的数据输入数据库将降低整体数据质量。变得难以使用。

因此,尽管对居民健康档案向社会开放的呼声很高,但现阶段进展缓慢的一个重要原因是医疗数据质量不高。如果没有在治理和处理方面投入高成本,居民将获得返还的健康记录数据容易产生偏差。

接下来是产权和分配的问题。目前的法律制度仍然无法解释和界定健康和医疗数据的所有权,特别是医疗数据的所有权。国家健康医疗大数据(东部)中心专家表示:医疗数据难以利用的主要原因是数据分散在各个主要机构、政府、医疗机构、科研机构、一些健康医疗公司在长期的业务中积累了相应的健康医疗数据资源,成为各种健康医疗数据的实际拥有者和控制者。这直接导致了定义数据所有权的困难。随着对原始数据的不断处理,医疗数据的所有权变得更加模糊。比如我们去医院做CT检查的时候,原始图像数据就是一个数据集。一旦医生诊断的内容被添加到图像数据集中,它将被生成了一个新的数据集。

目前有一种观点认为,医疗大数据反映的是个体的健康状况,应该属于患者个人。还有一种观点认为,医疗大数据只能通过医院的采集和录入产生,存储和保存也在医疗机构,应该属于医疗机构。还有一种观点认为,医疗数据的所有权在患者个人,控制权在医院,管理权在政府。第三方组织需要政府的支持和医院的配合,才能商业化开发利用。尽管各方争论不休,但在现实中,医疗大数据的所有权基本掌握在医院手中。

医疗数据所有权的模糊性,一方面制约了健康医疗数据的授权使用,另一方面也为患者个人信息权的保护带来了问题和隐患。在分配方面,数据与传统生产要素的区别在于其经济性的计算方式。很难用一种经济的方式来设计数据值。结合目前采集难度大、质量差异大的现状,管理者在计算医疗数据经济性时,无法准确计量和精细控制前端(采集、存储、治疗)成本,市场主体在处理半成品数据上花费了大量资金。在很大程度上不可能形成既能卖得出去的产品,又能获得足够的用户市场。“这就像在沙漠里淘金粉。谁都知道金粉是有价值的,但当投资淘金、加工黄金产品、产品质量和市场预期难以衡量时,企业就没有投资意愿,而金粉就在沙漠中沉睡”。

关于数据隐私和安全的最后说明。于数据安全问题涉及到各个行业,因此相关的解决方案也相对成熟。此外,“等级保护2.0”推动了医院数据安全建设。大量的医院已经有了一定程度的安全措施。但在数据共享方面,医院需要找到新的安全共享策略。

重新审视数据隐私。在一个具体的病人诊疗档案中,病人的姓名、身份证号码等基本信息往往被用作唯一标识符。但是,这些信息也属于应该受到保护的内容。因此,正确的做法应该是在不影响信息正确性的前提下,保护信息的匿名性。

需要注意的是,不同的信息在隐私保护方面具有不同的价值。因此,如果将所有的医疗信息一概而论,选择高层次的保护方式,会影响实际应用的效率,造成资源的浪费。因此,医院应建立较为完整的数据分类体系,针对不同类型的个人信息和数据选择不同的保护措施。

继续阅读