临床预测模型研究需要明确的数个问题
阅读了一些临床预测模型的论文,有一些个人的体会,和大家分享,有新的想法随时增加。
1.采用什么样的策略筛选预测变量?
- 临床预测模型的研究是建立在临床流行病学的基础上的研究。临床流行病学为疾病的结局筛选出了种种的危险因素,而临床预测模型则可以将这些危险因素综合在一个算法中,来实现其判断和预测的功能。这些经过临床流行病学筛选鉴定的危险因素,这里称之为“经证实的预测因素集”。与之相对的是,模型作者根据自己本地的数据用Lasso回归或者单因素检验等方法筛选出有统计学意义的预测变量而纳入到预测模型的方程中,这样获得的预测因素,可以称之为“私有的预测因素集”。预测模型要求要有一定的预测的准确度和外推性(适用于其它研究中心的数据),采用“经证实的预测因素集”较“私有的预测因素集”显然会使模型具有更好的外推性。如果有的经证实的预测因素却在本地的资料中没有表现出统计学意义,也应该纳入到模型构建方程中。
- 预测变量的个数。增加预测变量的个数的好处是可以增加模型预测的准确性,然而在保证一定准确性的前提下,预测变量的个数尽可能少,这会带来两方面的益处,首先,预测变量少导致需要患者提供的资料少,可以增加模型的适用性,更多的人可以使用该预测模型;其次,预测变量少可以增加模型使用的便利性,预测模型临床使用的主要形式是诺莫图或者网页计算器,特别是诺莫图,需要先计算出每个预测变量的得分,并获得总分,然后找到总分对应的疾病结局发生的概率。预测变量少可以减少计算的时间。网页计算器的出现大大增加了预测模型临床应用的便利性,使得模型开发者可以将模型开发的重点放在模型的准确性上。非线性模型无法制作诺莫图,网页计算器是其唯一的表现形式。
2. 构建临床预测模型的样本量是否足够?
- 预测模型研究目前没有样本量的计算模式。样本量不足,导致计算的预测因素的权重不准确,也导致模型外推性不好。对于预测模型的外部验证,有专家推荐,发生结局事件的人数和未发生结局的人数至少要100以上,才能达到一定的预测效能。构建模型的样本数往往多于外部验证和内部验证的样本数。
3. 采用线性算法还是非线性算法?
- 根据目前的经验来看,不是所有的非线性模型都优于线性模型(逻辑回归和Cox回顾),而某些非线性算法可以同时在区分度和校准度方面优于线性模型,比如,随机森林算法。根据个人构建临床预测模型的体验、比较多个算法的文献报道,随机森林算法确实在许多情况下优于线性模型,可以作为构建临床预测模型时常规考察的一个算法。值的一提的是,以上比较非线性模型与线性模型的评价指标是区分度和校准度,更加有价值的指标应该是影响了临床决策或者患者是否从中获益,但是目前相关的研究很少无法得出结论。
- 线性预测模型可以非常方便地用方程来描述模型,而方便地进行外部验证,还可以制作诺莫图或者网页计算器而进行临床的应用, 反观非线性模型, 如同一个“黑盒子”, 目前仍然没有建立成熟的分享方法, 对于外部验证和临床应用来说,暂时还无法实现。
4. 预测模型能不能进行临床应用?
临床上目前还不接受用临床预测模型来辅助进行临床决策,显然多数业内人士认为临床预测模型还达不到有用的程度。这个认知总体上并没有问题,但是这个问题还是值得我们仔细地分析一下。
-
首先,预测模型核心的指标是区分发生和不发生疾病结局事件的能力(一般会用区分度来表示),
目前这个能力预测模型只能达到70%,只有少数会达到90%。而且很少量的预测模型进行了临床价值的研究,所以无法进行临床应用。
专家呼吁应停止进行构建模型的研究,而应该进行临床价值方面的研究来推动预测模型在临床上的应用。
- 其次,预测模型告知了我们疾病结局的危险因素。预测模型中所采用的预测因素是公认的或者是作者认为的疾病结局的危险因素,有助于我们了解疾病结局密切危险因素并有意识地进行控制这些危险因素来预防疾病的发生。
- 再次,通过预测模型可以了解这些危险因素对疾病结局的影响力。不同的预测因素在方程中会计算出不同的权重,体现出预测因素对疾病结局的影响,对于线性模型来说,预测因素的β值以及其诺莫图中线段的长短,都可以体现各预测因素的权重,而对于非线性模型,也可以通过一些方式来计算。
5.检索预测模型的“窍门”关键词?
- “nomogram”,会检索到“线性”的预测模型,因为“非线性”的模型不能制作诺莫图,且论文中有发布相关的诺莫图供临床应用。
- “population-based”, 会检索到以社区人群为样本的预测模型,与医院的人群相区别。因为个人目前关注可供一般人群使用的预测模型,而不是供医生使用的预测模型。