天天看點

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

作者:中國人工智能學會

文/塗吉

摘 要

本文介紹了目前國内外肺結核影像智能識别的研究進展。主要探讨了通用技術路線、資料集來源及影像特征、網絡模型、效果評價及應用情況,并分析了肺結核計算機輔助診斷的未來發展趨勢。

關鍵字

醫學影像處理;肺結核;X射線;深度學習;計算機輔助診斷

0 引言

世界衛生組織釋出的2020年度《全球結核病報告》顯示,全球結核潛伏感染人群接近20億。2019年全球約1000萬人新發結核病,約140萬人死于結核病,結核病依然是全球頭号傳染病殺手。大陸結核病人數量位居世界第三,是全球結核病高負擔國家之一,2019年約有83.3萬人發病,其中3.3萬人死亡。雖然經過大陸政府的多年努力,對肺結核的防治已經走在世界前列,但随着社會和醫療水準的發展進步,肺結核病也面臨結核病菌耐藥性變強,流動人口增多對防控的制約,以及患者老齡化嚴重等一系列棘手問題。大陸肺結核防控明顯落後于新發傳染病。

肺結核也可能出現與新冠肺炎初期類似的症狀,不僅會對肺部造成損傷,治療時間更是長達6~8個月。對肺結核感染者和密切接觸者的快速篩查,有助于及時采取有效的防控措施,減少感染和減少後期防控付出的巨大代價。目前,痰菌檢查是結核病診斷的金标準。但是,結核病病原菌陽性診斷率低,一般至少需要做5次,且痰結核菌培養周期長、難以定量,不能得出更豐富的資訊。而即使臨床上已經證明了利用CT進行疾病診斷的誤診率和漏檢率都要低于胸部X射線影像,但綜合考慮到成本和大陸國内醫療水準參差不齊等現實情況,相對較貴的CT掃描裝置在不發達/欠發達地區的普及率遠遠不夠,是以截止到現在,X射線攝影依然是結核篩查優選的價格低廉且輻射量小的正常技術。

人工閱讀X射線影像易疲勞、耗費時間,漏診難以避免,而且影像科醫生的培養需要很長的周期,基層影像醫生嚴重不足,而大陸大部分的結核病患者在農村基層。另外,除了需要診斷出患者是否是肺結核,還需要根據患者的個體病情情況,進行對應的治療方案設計。是以,基于深度學習的肺結核X射線影像篩查技術,能幫助基層公衛人員挖掘更多的X射線影像資訊,提高人工智能閱片的實用性,為個性化治療和精準防控提供更多輔助資訊。

1 通用技術路線

基于深度學習的肺結核X射線影像篩查研究的通用技術路線,如圖1所示,可歸納為X射線影像學資料擷取、影像特征提取、影像特征生成和模式識别分類驗證四個部分。

X射線影像學資料來源,包括公開資料集和研究團隊專用資料集。資料集經過醫生标注和文獻總結,可生成肺結核影像特征知識庫。

影像特征提取主要分為影像預處理、深度學習預處理和影像特征提取三部分。通過對影像進行濾波和增強、複原、形态學處理,以及心肺影像區域分割,達到影像預處理的目的。深度學習預處理過程中,通過合理的從影像資料集中劃分測試集和訓練集,來增強網絡模型的魯棒性和泛化能力。一般會采用多個不同來源的資料集,是以還需要對輸入影像資料進行存儲格式的統一。不同的深度學習模型輸入圖像的大小會有不同,是以需要進行調整。訓練過程中,還需要進行色彩調整、标注框處理,以及模型參數的遷移學習。預期提取到的影像特征包括肺部的病變分布、粟粒的數目、纖維形态、肺與縱膈及心髒的相對鄰域結構變化、縱膈寬度、肺門大小、肺部組織的密度變化、肺部孔洞的大小和多少、肺葉邊緣是否光滑等。

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

圖1 肺結核X射線計算機輔助診斷技術路線

目前的肺結核影像處理,主要判斷是否患有肺結核的二分類問題。我們拓展二分類問題為四分類問題,進一步識别肺結核的四種臨床分型,即原發型肺結核、血行播散型肺結核、繼發型肺結核和結核性胸膜炎型肺結核。

對于肺結核影像處理分類效果的驗證,以醫生的診斷結果作為金标準。醫生通過收集病人的病例和病理資訊,根據專業經驗進行診斷和驗證影像智能輔助診斷的效果。

2 資料集及影像特征

公開資料集促進了肺結核深度學習的研究。目前為止,公開的肺結核資料集彙總如表1所示。

表1 肺結核X射線影像公開資料集

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

Montgomery資料集中的X射線影像來自美國馬裡蘭州蒙哥馬利縣衛生與公衆服務部的結核病控制項目。所有資料是DICOM格式。

Shenzhen set由美國馬裡蘭州國家醫學圖書館與中國深圳廣東醫學院深圳第三人民醫院合作建立。胸部X光片來自門診,使用飛利浦DR數字診斷系統捕獲。

Belarus肺結核X射線資料集是一個包含對正常結核病治療有耐藥性的白俄羅斯患者的資料集,共1049例。

TBX11K肺結核資料集由南開大學的程明明團隊建立,包含11200例X射線圖像,并有相應的肺結核疑似區域的邊框标注。

來自卡達多哈大學和孟加拉國達卡大學的團隊,與馬來西亞哈馬德醫療公司和孟加拉國的醫生合作,建立了一個結核病陽性胸片和正常對照胸片各3500例的資料庫。

此外,還有美國NIH的Chest X-ray-14公開資料集40GB(3萬位病人約11萬例X射線影像 ),包含肺不張、心髒肥大、肺滲出、肺滲透、肺部腫塊、肺結節、肺炎、氣胸、肺實變、肺水腫、肺氣腫、肺纖維化、胸膜肥厚和疝氣14種肺部疾病。該資料集用于肺結核計算機輔助診斷的缺點是,資料類别分布不平衡,部分資料集含有肺結核的病例征象,對肺結核診斷概念不明确。

基于目前的肺結核X射線影像資料集的研究表明,四種不同臨床分型的肺結核的影像特征差異較明顯,部分影像特征彙總如表2所示。

表2 肺部X射線的部分影像特征彙總

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

3 深度學習網絡模型

對于結核病計算機輔助診斷的研究,經曆了傳統圖像處理到深度學習的技術跨越。

傳統圖像處理階段,2013年,Tao Xu等提出了在胸部X射線影像中進行空洞檢測的雙尺度特征分類政策,優勢是計算效率高;劣勢是資料集較小,分類條件有嚴格限制。2014年,Kumar等采用Gabor濾波器進行分割和支援向量機進行分類,但是其資料集僅80張影像。2015年,Hogeweg等手工提取紋理和形态特征,分類效果媲美醫生,但是AUC值不佳。

肺結核影像深度學習階段,2016年,Hwang等首次應用卷積神經網絡 (CNN) 進行肺結核分類。2017年,Rahul Hooda等提出一種淺層的CNN,包括7個卷積層和3個全連接配接層,并比較了三個不同的優化器,最終證明 Adam優化器在肺結核分類問題中的性能最優。2018年,Rajaraman 等采用預訓練的CNN實作特征提取,分類器采用支援向量機,準确率有所提升。2019年,Pasa等在英偉達GTX 1050 Ti上采用改進的輕量化 CNN實作了肺結核的分類,但是該方案不适用于較大的資料量。2020年,南開大學程明明團隊的CVPR論文公開了帶有标注的TBX11K肺 結 核 數 據 集, 并 改 進 了SSD、FCOS、RetinaNet和Faster R-CNN,用于健康、非肺結核肺疾病、肺結核三分類,以及核病竈區域檢測。2021年,Ayaz等設計Gabor濾波器人工特征提取和深度學習特征提取相融合的內建學習模型,該方案在面對不同來源的樣本時,遷移效果将會欠佳。

目前為止,文獻中應用于肺結核影像分割、分類和檢測的深度學習網絡模型有AlexNet、GoogleNet、VggNet、ResNet18、ResNet50、SqueezeNet、U-net、ResNet101、MobileNet、ChexNet、InceptionV3、DenseNet和DeuseNet201等。對CNN網絡結構應用于肺結核分類的改進研究,主要集中在先分割再分類、引入注意力機制、采用金字塔池化、引入殘差網絡或殘差單元、改進優化器和內建學習等方面。

圖2所示為經典的以AlexNet卷積神經網絡為示例的,結核X射線影像篩查深度學習網絡模型。将X射線影像的輸入大小調整為227×227×3, 經過多次卷積、線性整形、池化、全連接配接和歸一化。使用Relu作為非線性激活函數,克服梯度消失問題。全連接配接采用了128個特征的展平,用了2層來增加非線性拟合的效果。全局池化采用了空間金字塔結構,從網絡的不同層中,抽取不同尺度的特征圖進行預測。采用交叉熵損失函數,對網絡的預測值和真實的标簽值之間的誤差進行準确度量。引入尺度變換和平移變化,使資料分布更加符合真實分布的同時,為網絡帶來更高的靈活性,提高網絡的泛化能力。包含的肺結核影像特征資訊轉化為數值,經過softmax歸一化處理,得到是否患肺結核的二分類的判決機率。

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

圖2 肺結核X射線經典深度學習網絡模型示例

最新的肺結核二級內建深度學習卷積神經網絡模型的示例,圖3所示。采用AlexNet和ResNet18的內建深度學習網絡模型,對同一張X射線影像,将其生成為227×227×3和224×224×3這2個資料大小,分别輸入到淺層AlexNet網絡和深層ResNet18網絡進行學習。淺層網絡做二分類任務,識别是否患肺結核。深層網絡做精細特征分類,完成四分類任務。殘差網絡ResNet18中産生的512個特征,與AlexNet中産生的128個特征展平為640個特征,通過softmax歸一化,給出肺結核 4 種臨床分型的各自判别機率。

4 效果評價與應用進展

評價基于深度學習的肺結核X射線影像的分類效果的名額,主要有準确率、受試者工作特征曲線(ROC)和曲線下面積(AUC)。

如表3所示,準确率=(真陽+真陰)/(真陽+假陽+真陰+假陰),特異性或假陽性率=假陽(假/陽+真陰),敏感度或真陽性率=真陽(真陽/+假陰)。

表3 混淆矩陣

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

ROC曲線的橫坐标為特異性,縱坐标為敏感度,反映特異性與敏感度的關系,是實驗準确性的綜合代表。AUC為ROC曲線下面積,AUC值越大,代表分類的結果越準确。

基于深度學習判斷是否感染肺結核的二分類的效果舉例,如表4所示。

表4 Montgomery資料集的二分類效果

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

市場上被收錄到世界衛生組織阻止肺結核夥伴關系的肺結核計算機輔助診斷商業産品有九峰醫療的JFCXR-1、DxTB、CAD4TB、XrayAME、AXIR、InferRead DR Chest、JLD-02K、CAD4TB、qXR和INSIGHT CXR,其中僅JLD-02K取得了FDA認證。

經 過 痰 培 養 來 作 為 金 标 準 診 斷 肺 結 核,檢驗出 qXR産品的敏感度為0.93[95%, CI 0.89~0.95,p=0.0002], 特異性為0.75 [0.73~0.77, p<0.0001]。CAD4TB産品的敏感度為 0.93[95%,CI 0.90~0.96,p<0.0001],特異性為0.69[0.67~0.71, p=0.0003]。世界衛生組織推薦的産品敏感度為0.90,特異性為0.70。

由于X射線成像過程中環境因素的幹擾,包括患者呼吸帶來的細微抖動、裝置的熱噪聲等,成像時會伴随噪聲元素。在神經網絡進行深度學習時,随着網絡層數的增加,這些噪聲像素在特征圖的權重也會增加。另外,不同裝置及不同技師采集的X射線影像,一緻性有待提升。此外,肺部疾病患病類型的分類依據在影像上的表現有些特征往往差異不明顯,但是生理特征差異可以明顯區分。例如,肺結核和新冠肺炎在有些影像征象上難以區分。但是,肺結核以咳痰2周以上或痰中帶血為常見症狀,此外還有低燒、夜間盜汗、午後發熱、胸痛、疲乏無力、體重減輕、呼吸困難等;新型冠狀病毒肺炎以發熱、乏力、幹咳,逐漸出現呼吸困難為主要表現,少數患者伴有鼻塞、流涕、腹瀉等症狀,部分患者僅表現為低熱、輕微乏力等。是以,僅使用X射線影像進行肺結核深度學習特征識别與分類,存在一定的局限性,需要結合影像組學資料進行多元度的深度學習。

5 結束語

肺結核X射線影像的深度學習篩查技術,可更好地輔助基層公共衛生人員開展工作,為個性化治療和精準防控提供技術支撐。但是,肺結核X射線影像計算機輔助診斷技術的應用,還需要解決三個具體問題。① 肺結核X射線影像樣本不均衡對深度學習準确率造成的影響;② 如何有效地對肺結核、肺炎、肺癌等肺疾病進行鑒别診斷;③ 如何在提高模型訓練效率的同時,兼顧模型訓練準确率。

肺結核作為傳染性疾病,具有一定的社會屬性,采用基于影像組學的病理-生理-社會的模型預測及計算機輔助診斷技術,是一個值得探索的技術路徑。

(參考文獻略)​

AI研習丨基于深度學習的肺結核X射線影像篩查技術研究進展

選自《中國人工智能學會通訊》

2021年第11卷第9期

智慧醫療專輯

繼續閱讀