天天看點

臨床預測模型研究需要明确的數個問題

臨床預測模型研究需要明确的數個問題

閱讀了一些臨床預測模型的論文,有一些個人的體會,和大家分享,有新的想法随時增加。

1.采用什麼樣的政策篩選預測變量?

  • 臨床預測模型的研究是建立在臨床流行病學的基礎上的研究。臨床流行病學為疾病的結局篩選出了種種的危險因素,而臨床預測模型則可以将這些危險因素綜合在一個算法中,來實作其判斷和預測的功能。這些經過臨床流行病學篩選鑒定的危險因素,這裡稱之為“經證明的預測因素集”。與之相對的是,模型作者根據自己本地的資料用Lasso回歸或者單因素檢驗等方法篩選出有統計學意義的預測變量而納入到預測模型的方程中,這樣獲得的預測因素,可以稱之為“私有的預測因素集”。預測模型要求要有一定的預測的準确度和外推性(适用于其它研究中心的資料),采用“經證明的預測因素集”較“私有的預測因素集”顯然會使模型具有更好的外推性。如果有的經證明的預測因素卻在本地的資料中沒有表現出統計學意義,也應該納入到模型建構方程中。
  • 預測變量的個數。增加預測變量的個數的好處是可以增加模型預測的準确性,然而在保證一定準确性的前提下,預測變量的個數盡可能少,這會帶來兩方面的益處,首先,預測變量少導緻需要患者提供的資料少,可以增加模型的适用性,更多的人可以使用該預測模型;其次,預測變量少可以增加模型使用的便利性,預測模型臨床使用的主要形式是諾莫圖或者網頁電腦,特别是諾莫圖,需要先計算出每個預測變量的得分,并獲得總分,然後找到總分對應的疾病結局發生的機率。預測變量少可以減少計算的時間。網頁電腦的出現大大增加了預測模型臨床應用的便利性,使得模型開發者可以将模型開發的重點放在模型的準确性上。非線性模型無法制作諾莫圖,網頁電腦是其唯一的表現形式。

2. 建構臨床預測模型的樣本量是否足夠?

  • 預測模型研究目前沒有樣本量的計算模式。樣本量不足,導緻計算的預測因素的權重不準确,也導緻模型外推性不好。對于預測模型的外部驗證,有專家推薦,發生結局事件的人數和未發生結局的人數至少要100以上,才能達到一定的預測效能。構模組化型的樣本數往往多于外部驗證和内部驗證的樣本數。

3. 采用線性算法還是非線性算法?

  1. 根據目前的經驗來看,不是所有的非線性模型都優于線性模型(邏輯回歸和Cox回顧),而某些非線性算法可以同時在區分度和校準度方面優于線性模型,比如,随機森林算法。根據個人建構臨床預測模型的體驗、比較多個算法的文獻報道,随機森林算法确實在許多情況下優于線性模型,可以作為建構臨床預測模型時正常考察的一個算法。值的一提的是,以上比較非線性模型與線性模型的評價名額是區分度和校準度,更加有價值的名額應該是影響了臨床決策或者患者是否從中獲益,但是目前相關的研究很少無法得出結論。
  2. 線性預測模型可以非常友善地用方程來描述模型,而友善地進行外部驗證,還可以制作諾莫圖或者網頁電腦而進行臨床的應用, 反觀非線性模型, 如同一個“黑盒子”, 目前仍然沒有建立成熟的分享方法, 對于外部驗證和臨床應用來說,暫時還無法實作。

4. 預測模型能不能進行臨床應用?

臨床上目前還不接受用臨床預測模型來輔助進行臨床決策,顯然多數業内人士認為臨床預測模型還達不到有用的程度。這個認知總體上并沒有問題,但是這個問題還是值得我們仔細地分析一下。

  • 首先,預測模型核心的名額是區分發生和不發生疾病結局事件的能力(一般會用區分度來表示),

    目前這個能力預測模型隻能達到70%,隻有少數會達到90%。而且很少量的預測模型進行了臨床價值的研究,是以無法進行臨床應用。

    專家呼籲應停止進行構模組化型的研究,而應該進行臨床價值方面的研究來推動預測模型在臨床上的應用。

  • 其次,預測模型告知了我們疾病結局的危險因素。預測模型中所采用的預測因素是公認的或者是作者認為的疾病結局的危險因素,有助于我們了解疾病結局密切危險因素并有意識地進行控制這些危險因素來預防疾病的發生。
  • 再次,通過預測模型可以了解這些危險因素對疾病結局的影響力。不同的預測因素在方程中會計算出不同的權重,展現出預測因素對疾病結局的影響,對于線性模型來說,預測因素的β值以及其諾莫圖中線段的長短,都可以展現各預測因素的權重,而對于非線性模型,也可以通過一些方式來計算。

5.檢索預測模型的“竅門”關鍵詞?

  • “nomogram”,會檢索到“線性”的預測模型,因為“非線性”的模型不能制作諾莫圖,且論文中有釋出相關的諾莫圖供臨床應用。
  • “population-based”, 會檢索到以社群人群為樣本的預測模型,與醫院的人群相差別。因為個人目前關注可供一般人群使用的預測模型,而不是供醫生使用的預測模型。

繼續閱讀