請點選上面“思影科技”四個字,選擇關注我們,思影科技專注于腦影像資料處理,涵蓋(fMRI,結構像,DTI,ASL,EEG/ERP,FNIRS,眼動)等,希望專業的内容可以給關注者帶來幫助,歡迎留言讨論,也歡迎參加思影科技的其他課程。(文末點選浏覽)
在臨床治療中,獲得比行為學測量結果更加準确的具有分類意義的神經生理名額越來越重要,因為在行為學認知測量中,由于其使用結果标量來反應認知能力的特性,難以觀察到複雜成因的細節和發生過程,是以,在臨床表現相似的疾病中,行為學認知測量其實在某種程度是存在較大局限性的。尋找到能夠對疾病診斷和分類具有更高敏感性的神經生理名額成為了補充這一缺陷的重要途經,在這條道路上,神經影像學和機器學習的結合為這種思路提供了最基本的操作方法。是以,難點便在于合适的神經影像學名額的選擇、大樣本被試、嚴格的被試篩選、嚴肅的統計分析和有效的機器學習方法的選擇等方面,這篇文章在以上這些重點中都做出了很大努力。
首先,其整體架構明晰,研究目的直指:認知測試在辨識AD與bvFTD時缺乏準确性這一問題。在明晰的背景分析後,提出了科學研究中與臨床實際治療中最容易擷取并且具有高關注度的T1結構像作為神經影像學手段來擷取灰質密度圖作為神經生理名額。
其次,對以往研究中存在的問題進行逐一解決,在增大樣本量的同時,還增加主觀性認知障礙患者(SCD)進入對照組,以模拟在臨床治療中面對的複雜情況。在灰質密度圖計算中,為了避免DARTEL方法帶來的資料分析bais,對預測集資料和訓練集資料單獨進行了處理(處處展現細節)。然後,對資料進行了嚴格的統計。
作者首先通過行為學測量結果的分類準确性統計驗證了其提出的認知測試在辨識AD與bvFTD時缺乏準确性這一觀點,然後使用SVM(用的PRoNTo):(詳細了解請直接點選:第七屆腦影像機器學習班 )方法對灰質密度對AD、bvFTD以及其對照組的分類能力和預測能力進行了分析,結果表明基于GM密度圖的機器學習算法在分類AD與bvFTD患者時優于基于神經心理學測試結果的分類。
盡管從應用臨床的角度來看,作者獲得的具有良好的分類和預測能力的模型還難以直接适用于臨床診斷,但是其表現出的具有統計學意義的分類結果表明了,使用神經生理名額作為疾病分類診斷的科學意義和臨床意義是極為重大的。這些方法将在未來的研究和臨床治療中發揮出巨大的能量。
在本研究中,通過使用從多個成像儀獲得的标準T1權重結構圖像計算的灰質(GM)密度圖,使用獨立的訓練和預測資料,研究基于圖像的分類器在個體患者中區分阿茲海默病(AD)和行為變異額颞葉癡呆(bvFTD)的診斷準确性。
材料和方法:84名AD患者,51名bvFTD患者和94名對照被分為獨立的兩組——訓練組(n=115)和預測組(n=114),二者有相同的診斷和影像學類型分布(即兩組資料在診斷特征和成像特征上是同質的)。
使用診斷狀态和灰質密度圖訓練SVM分類器并生成體素判别圖。利用判别函數分析方法,估計提取的權值對預測單被試分類的适用性。基于圖像的分類器和神經心理學z評分,計算ROC曲線及其曲線下面積(即AUC)。
結果:AD患者與對照組患者SVM的訓練準确率為85%,bvFTD患者與對照組相比為72%, AD 患者與bvFTD 患者相比為79 %( P<0.05)。使用判别圖預測個體患者診斷時,區分AD患者與對照組的準确率分别為88%,bvFTD患者與對照組的準确率分别為85%,AD患者與bvFTD患者準确率為82%,具有良好至優異的AUC範圍(0.81-0.95;P <0.001)。基于GM密度圖的機器學習算法在分類AD與bvFTD患者時優于基于神經心理學測試結果的分類。
結論:SVM可用于個體患者區分,幫助臨床醫生做出診斷。通過使用常見的T1權重結構MR成像,SVM可以區分出和正常衰老人群相比AD患者與bvFTD 患者的疾病特異性GM模式。
Alzheimer病(AD)和行為變異額颞葉癡呆(bvFTD)是早發性癡呆的最常見原因。這些疾病具有不同的臨床診斷标準;然而,他們臨床症狀的重疊使得鑒别診斷變得複雜。各種研究表明,認知測試在辨識AD與bvFTD時缺乏準确性(在行為學認知測量中,由于其結果标量來反應認知能力的特性,難以觀察到複雜成因的細節和發生過程,是以,在臨床表現相似的疾病中,行為學認知測量其實在某種程度是存在較大局限性的)。
磁共振(MR)成像可用于在疾病早期檢測疾病特異性的宏觀腦變化,目前關于腦灰質變化的研究區分bvFTD和AD時僅報告腦結構的組間差異,而不是對個體病人進行評估(但這一點恰恰是對臨床治療最重要的)。
AD和bvFTD的萎縮模式重疊。例如,額葉萎縮在AD病人中出現,海馬萎縮無法排除bvFTD,因為它也在正常衰老過程中發生。皮層萎縮在疾病早期并不突出,這阻礙了傳統上用于單一受試者診斷的視覺評定量表的可用性。其他成像模式,如正電子發射斷層掃描(PET)和功能和擴散權重MR成像,可以區分AD和bvFTD。然而,這些方式更具有侵入性和耗時。是以,它們在臨床環境中更難實施(PET是具有侵入性的,功能成像和擴散權重成像受到序列影響,時間确實要更長,才能獲得較好的效果)。
記憶門診患者篩查方案通常包括具有T1權重三維序列的MR檢查。該序列捕獲疾病特異性結構變化,并且在成像器中是穩定的。
關于AD和bvFTD的SVM分類的現有文獻顯示了其局限性:從整個額颞葉癡呆譜系中區分AD的主要方法表現為語言變異,其不對稱萎縮的灰質結構異常驅動了分類。
但交叉驗證後的準确度估計(例如,重複使用訓練資料進行預測)通常存在偏差,尤其是當樣本量較小時。在本研究中,作者使用從多個成像儀的标準T1權重像計算GM密度圖,使用獨立的訓練和預測資料,研究了AD和bvFTD之間基于圖像的分類器在個體患者中的診斷準确性(其研究問題明确的反應了每一個在背景分析中提到的問題)。
材料和方法
這項研究回顧性地包括84名AD患者、51名bvFTD患者和53名主觀性認知障礙(scds)患者,他們在2009年9月和2013年10月期間通路VU大學醫學中心的阿爾茨海默病中心或鹿特丹伊拉斯谟大學醫學中心的阿爾茨海默病中心。
标準化的1天評估包括病史、基于病人知情者的病史資訊、身體和神經檢查,血液測試、神經心理學評估和磁共振成像。基于多學科共識的可能AD診斷采用了國家老齡化研究所和阿爾茨海默病協會的核心臨床标準,bvftd的診斷遵循國際前沿颞葉癡呆聯合會标準。SCD患者報告有記憶障礙,但認知功能正常;他們不符合輕度認知障礙、癡呆或其他神經或精神疾病的标準(嚴格的診斷标準和被試篩查是此類文章的重點之一)。
診斷由一個聯合小組重新評估,以盡量減少中心效應。通過當地報紙上的廣告招募了總共41名認知健康的對照受試者。對照受試者進行病史采集,體格檢查,神經心理學測試和腦部磁共振成像。對照受試者和患有SCD的患者形成了一般人群的代表性對照組。
患者和對照受試者的入選标準是三維T1權重MR圖像的可用性和年齡在40至80歲之間。排除标準是:大的圖像僞影,MR圖像處理期間的軟體故障,以及除萎縮之外的大腦異常,包括深GM結構中的嚴重白質高信号和腔隙性梗塞。(劃重點!)根據這些标準,沒有患者被排除在外。共有229名個體(84名AD患者,51名患有bvFTD的患者,94名對照受試者即健康對照被試加SCD患者共同組成)用于分析。
患者和對照組随機分為訓練組(n = 115;42例AD患者,26例bvFTD患者,47例對照受試者)和預測組(n = 114; 42例AD患者,25例bvFTD患者,47例對照組),具有相同的診斷分布,年齡,性别和成像類型。教育評分為七分。疾病持續時間定義為護理人員首次意識到症狀與診斷之間的時間。
神經心理學評估
回顧性地從阿姆斯特丹癡呆症隊列獲得神經心理學資料。使用(MMSE)來評估癡呆症的嚴重程度和額葉評估測驗評估額葉功能障礙。對于認知測試,使用标準化的神經心理學組合測試,其中包括(a)記憶(b)語言(c)注意力,(d)執行功能。從原始測試分數來計算z分數(即進行資料标準化,以能夠使資料更加正态,滿足參數檢驗的要求)。計算由至少一個神經心理學任務表示的認知域的複合z分數(可以了解為資料降維)。
MR圖像采集
在VU大學醫學中心的阿爾茨海默病中心的檢查使用兩個3T成像儀(Signa HDxt,GEHealthcare;Ingenuity TF PET / MR,Philips Medical Systems)。來自鹿特丹伊拉斯姆斯大學醫學中心的受試者在萊頓大學醫學中心使用3T成像儀( Achieva; Philips Netherlands)進行檢查。成像序列包括全腦近似同位素(即近似立方體)三維T1權重成像。在VU 大學醫學中心的阿爾茨海默病中心采集圖像體素大小為:0.98*0.98*1mm,其成像時間:4 分57秒或1 *1* 1 mm,其成像時間為6分14秒。萊頓大學醫學中心體素尺寸:0.88*0.88*1.2mm;成像時間,4 分57秒)。
MR圖像處理
對Signa-HDxt成像儀的三維T1權重圖像進行梯度非線性畸變校正。所有圖像都轉換為NiFTI格式。使用FSL線性配準工具(即FLIRT)計算到MNI空間的線性轉換。用SPM8的基于體素的形态測量工具箱VBM8計算GM密度圖(詳細了解,請點選這裡:
第七屆磁共振腦影像結構班
在VBM8中單獨處理訓練和預測資料以避免bias(這裡可以了解為由于共同資料處理帶來的資料特征的相似性進而造成的bias,因為作者使用了DARTEL的算法來進行結構資料的分割和配準)。
VBM8工具箱的第一個子產品将三維T1權重圖像分割為GM,白質和腦脊液,并通過DARTEL算法配準到MNI空間。在去除非腦部分後,組織分類密度圖被配準到模闆用以計算針對個體大腦尺寸校正後的組織量。直接對資料進行校正,這樣統計時就無需再次校正。然後使用8mm的全寬半高各向同性高斯核對圖像做平滑處理。
Svm模式識别
使用模式識别神經影像工具箱(即PRoNTo)進行模式識别。設定所有輸入的平均值的0.2作為門檻值(做VBM時常用的門檻值)來定義mask。采用二進制SVM分類來分類:
(a)AD患者與對照受試者
(b)患有bvFTD 的患者與對照受試者
(c)患有AD的患者與具有bvFTD的患者。
采用留一交叉驗證并建構體素判别圖。這些判别圖包含由SVM習得并投回輸入空間的模型參數。模型訓練表現由準确性、敏感性和特異性衡量(三個機器學習中最常見的判斷模型訓練效力的名額)。使用置換檢驗(1000次)來得到平衡精度的P值(不知道你會不會和我想得一樣,1000次是不是少了點兒?)。
新個體中的SVM預測
獨立預測集中的個體患者診斷如下:單個患者GM密度乘以從線性SVM計算的模型權重,對該乘積的積分設定門檻值進行分類。使用SPSS軟體确定特異性和敏感性。
統計分析
統計分析用上述SPSS軟體。通過使用單變量方差分析,Kruskal-Wallis 檢驗(單因子方差分析,主要用于進行多個群組之間比較時,因群組不滿足正态分布而不能使用ANOVA比較,所常采用的統計相似檢驗方法)和卡方檢驗來評估組間差異。
複合認知域z得分進行多變量方差分析和Bonferroni校正,其中年齡,性别,教育水準和疾病持續時間為協變量。AD患者與bvFTD患者進行一次性交叉驗證的逐漸判别函數分析确定了神經心理學測試的判别能力;預測因子是記憶,語言,注意力和執行功能的四個z域,并計算ROC和ROC曲線下面積(AUC)。
利用三組間的兩兩判别函數分析,并進行交叉驗證,以确定支援向量機預測的準确性。計算認知測試的ROC和AUC。統計顯著性設定為P<0.05(值得一提的是,在文章中統計檢驗的部分作者标注了進行該項統計檢驗的操作者,并且明确的給出了該操作者執行該部分統計檢驗方法的從業經驗(以年為機關),這給出一個資訊是統計檢驗方法的使用對科研結果準确性而言是很重要的)。
結果:
人口統計學
訓練集和測試集的結果見表1:

根據年齡(P=.97),性别(P = .96),成像器類型(P = .99) 和診斷(P = .99)對資料進行分類。疾病持續時間(P= .88)或MMSE(簡易精神狀态檢查)(P = .97)沒有差異。
在訓練和預測集中,患者群體的教育水準沒有差異(訓練集,P=.463;預測集,P = .162),性别(訓練集,P =.912;預測集,P = .152),成像器類型(訓練集,P= .954;預測集,P = .937)或疾病持續時間(訓練集,P =.164;預測集,P = .434)均無差異(見表2)(作者使用了多中心不同成像儀器的資料,是以确認資料間的差異不是由于這些其他變量導緻的是非常重要的)。(劃重點!)
AD 患者和bvFTD患者的額葉評估測驗評分低于對照組(P <0.001)。AD患者年齡大于對照組(訓練集,P = .042;預測集,P = .004),MMSE評分較低(訓練集, P = .002;預測集, P = .003 )(兩組患者的評分均為輕度疾病階段)。
AD患者在記憶力測試中比bvFTD患者(訓練集,P < .001;預測集,P = .002)和對照組(P < .001)表現要差;而且兩個病人組在語言測試中都比對照組要差(訓練集,P = .022;預測集,P<.001)。AD患者和bvFTD患者在注意力和執行功能測試中的表現比訓練組中的對照受試者差(P= .02)。在預測集中,隻有AD患者在注意力測試中表現比對照組更差(P =.001)并且在執行功能測試中得分低于bvFTD(P = .014)和對照組(P<.001)。
這四個複合認知z域使81%(68/89)的AD患者與對照組區分開,并用于正确分類42例AD患者中的23例(55%)和47名對照組中的45名(96%)((Wilks, λ, 0.482;P<.001),記憶力具有最高的權重(這一點表明記憶力在區分AD患者與對照組時具有更強的預測能力)。ROC曲線顯示了記憶域的優異性能(AUC,0.95;p<.001)。
對于 bvFTD 與對照受試者, 81 %( 58/72 ) 的分類是正确的:總共 有15(60%)名bvFTD (共25)和43(92%)(共47名)對照受試者(0.527; P<.001)進行了正确分類。語言的負載最高(與AD患者組與其對照組最顯著的分類貢獻因子不同)。ROC曲線顯示語言域的優異性能(AUC,0.92; P,.001)。
然而,對于AD組與bvFTD組的分類,四個複合認知z域僅在66%(67/44 中)中實作了正确的分類(在這裡,作者證明了自己在文章背景分析中提出的行為學測量結果對于AD患者和bvFTD患者分類的不敏感性)。42例AD患者中33例(79%)和25例bvFTD患者中11例(44%)被正确分類(Wilksl,0.864;P=0.003)。記憶權重最高。ROC曲線顯示了記憶域的性能(AUC,0.74;P = .002)
支援向量分類:訓練準确性
圖1顯示了每個分類器的體素判别圖,并且在最大正負權重值的30%處設定門檻值。
結果總結見圖2。
在訓練集中,對于AD組與對照組,準确率為85%(P =.001),敏感性為83%(P = .001), 特異性為87 %(P = .001 )。對于bvFTD組與對照組,準确率為75%(P =.001),敏感性為62%(P =.001), 特異性為83%(P = .029)。對于AD組與bvFTD組,準确率為81%(P =.001),靈敏度為88%(P =.001),特異性為69%(P = .001)。
泛化性:新被試中的單個體診斷預測
結果總結見圖3。
使用判别權重圖預測,在AD組與對照組中,正确預測88%(78/89):86 %(36/42)的AD患者和 89 %(42/47)的對照受試者( P<.001)是正确的。曲線顯示出優異的表現(AUC,0.95; P<.001)。在bvFTD與對照組中, 正确預測85%(61/72):正确預測bvFTD患者60%(15/25)和98%(46/47)對照組被試(Wilksλ,0.579; P<.001)。該ROC曲線顯示出良好的性能(AUC,0.87;P<.001)。AD組與bvFTD組中正确預測82%(55/67):其中正确預測AD患者93%(39/42),bvFTD患者64%(16/25)(Wilks,λ,0.718;P<.001)。ROC曲線顯示出良好的表現(AUC,0.81;p<.001)。
讨論
1)此研究中使用的病例均具有相對正常的MMSE分數,表明處于病程的早期和輕度的疾病相關GM萎縮,僅選取那些MMSE分數、病程和年齡均表明輕度癡呆的bvFTD患者。SVM分類器可以辨識出AD和bvFTD患者的GM萎縮差異腦區,這些腦區在現有文獻中也已經證明。
2)此研究采用獨立的訓練資料和預測資料,能夠評估模型的泛化能力,避免了僅使用留一交叉驗證引起的的偏差結果。
3)此研究使用較大的樣本量,基于全腦體素分析。
4)其他研究表明,使用氟脫氧葡萄糖PET和單光子發射CT等其他模态能夠提高分類的準确度,但是這些模态在大多數醫院裡并不能獲得,此研究中的T1權重像的廣泛适用性和MR成像的無侵害性,以及基于機器學習分類的自動化,使得它能夠成為診斷區分AD和bvFTD的一種有用方法(但從臨床使用的角度來看,還需要進一步對SVM模型進行優化,選擇更合适的模型才可能獲得更好的分類效果,畢竟從臨床來講,良好的分類效果(81%-95%)還是遠遠不夠的),尤其是在缺少PET成像和腦脊液測量的醫療中心。
5)一些關于腦萎縮橫截面和縱向效應的研究表明了AD患者、bvFTD患者和正常對照的組間差異,通過檢測結構特征實作準确的單被試診斷将有助于臨床應用,此研究通過把健康年長被試和SCD人群合在一起作為對照組,緻力于單個被試診斷分類在真實臨床環境中的實作。
6)由于診斷的異質性,針對來自不同記憶診所的樣本時,分類器的預測準确率也會不同。而此研究利用以前的診斷結果選擇樣本,這可能會提高預測準确率。
可能的局限性:
(1)使用二進制分類器,來自兩個候選組之外的測試用例将被錯誤地配置設定給其中一個。使用多類分類器将提高方法的診斷有用性。二進制分類器通過基于GM密度的局部變化預測不同的癡呆亞型來輔助診斷過程。
(2)基于全腦方法的分類效果可能不是最理想的,使用感興趣區域會提高分類準确度。但是基于感興趣區域的方法存在缺點:1)提取感興趣區耗時,會限制在日常實踐中的實施;2)有限的搜尋量會限制可檢測的病症的數量。然而在有診斷支援的情況下,這不會造成特别嚴重的限制。
總結:
此文章的亮點主要表現在以下兩個方面:
方法的先進性:
1)實作了在不同癡呆類型患者和正常對照之間的根據灰質密度圖的自動分類,且準确度達到75%-85%。
2)訓練的分類器在用于單個患者診斷時,具有優良的預測準表現(AUC為0.81-0.95)。
3)分類器是基于廣泛使用的T1結構權重像檢查的,有利于單被試自動診斷方法的應用。
對病人護理的影響:
1)基于機器學習的分類方法能夠促進并改善診斷, 特别是在沒有經驗豐富的神經放射學家或其他支援性診斷措施的情況下;
2)基于機器學習的分類器比基于神經心理學測試的分類準确度高;
3)基于圖像的自動分類器在可用于未來高風險組人群的癡呆症的篩查;
原文
Alzheimer disease and behavioral variant frontotemporal dementia: automatic classification based on cortical atrophy for single-subject diagnosis
C Möller, YAL Pijnenburg, WM van der Flier… - Radiology
如需原文及補充材料,請加微信:siyingyxf 索取。