天天看點

每周一篇 文獻閱讀—paper2譯文

NoduleNet: Decoupled False Positive Reduction for Pulmonary Nodule Detection and Segmentation)

  • 譯文
    • 摘要
    • 引言
    • NoduleNet
    • 結果
    • 結論

文章連結:https://arxiv.org/pdf/1907.11320.pdf

譯文

摘要

肺結節檢測,減少假陽性和結節分割代表了胸部CT圖像計算機分析中最常見的三項任務。最近,針對每個任務的提出的方法中基于深度學習的方法最受青睐。然而,訓練深度學習模型以分别解決每個任務可能不是最優解決方案 — 資源緊張、且沒有特征不能共享。在這裡,我們提出了一種新的端到端3D深度卷積神經網絡DCNN,稱為NoduleNet,以多任務方式聯合解決結節檢測,減少假陽性和結節分割。為了避免不同任務之間的摩擦并鼓勵功能多樣化,我們結合了兩個主要的設計技巧:(1) 用于結節檢測和減少假陽性的解耦特征圖,(2)用于提高結節分割精度的分割細化子網。 對大規模LIDC資料集的大量實驗表明,與僅解決結核檢測任務的基線模型相比,多任務訓練非常有益,結節檢測精度提高了10.27%。 我們還進行了系統的消融研究,以突出每個附加元件的貢獻。

引言

肺癌在全世界的發病率和死亡率最高[3]。 肺結節的早期診斷和治療可以提高患者的生存率。 計算機斷層掃描(CT)已被廣泛使用并證明對于檢測肺結節是有效的。 然而,在CT掃描中手動識别結節通常是耗時且繁瑣的,因為放射科醫師需要逐片地讀取CT掃描,并且胸部CT可能包含超過200個切片。 準确而精确的結節分割可以更深入地評估結節的形狀,大小和變化率。 當發現結節時,通常需要在3-12個月内進行随訪掃描以評估其生長速度[7]。 肺惡性良性腫瘤的生長可能是惡性惡性良性腫瘤的名額,準确的結節分割可用于測量結節的生長速度。

近年來,深度卷積神經網絡已成為自動檢測和分割肺結節的主要方法,并取得了巨大成功。 最先進的結核檢測架構經常利用3D區域建議網絡(RPN)[12]進行結節篩查[15,19,14,10],然後使用3D分類器來減少假陽性[5,16]]。 雖然在[8]中也提出了單級探測器,但它們的命中标準與更常用的[14]不同。 此外,由額外分類器提供的細化可以校正由檢測器産生的一些誤差。 在結節分割方面,主要使用U-Net [13]和V-Net [11]類結構[17,18,1]。 在實踐中,用于肺結節檢測和分割的計算機輔助診斷(CAD)系統通常由幾個獨立的子系統組成,分别進行優化。

完全獨立地處理每個任務是有一些限制的。 首先,訓練幾個深度卷積神經網絡是耗時且耗資源的。 盡管每個元件的設計目的不同,但它們共享提取肺結節特征表示的通用過程。第二,整個系統的性能可能不是最佳的,因為單獨訓練幾個系統會阻止彼此之間的通信和内在的特征表示的學習。直覺地說,結節的分割掩模應該為神經網絡學習區分特征提供強有力的指導,進而提高結節檢測的性能。

雖然多任務學習(MTL)和特征共享為組合不同任務提供了有吸引力的解決方案,但是不成熟的實作可能會導緻其他問題[4]。首先,由于定位和分類的目标不比對,如果使用相同的特征映射圖執行這兩個任務,得到的結果很可能是不是最優的。其次,大的感受野可能會整合來自圖像其他部分的無關資訊,這可能會對結節的分類産生負面影響和混淆,尤其是小結節的分類。 [4]通過解耦定位和分類來解決自然成像中的問題。但是,在不共享任何特征提取bakbone的情況下完全分離這兩個任務,雖然可以防止兩個網絡之間的串擾,是以可能不是最有效的。是以,提出了一種解耦方法來減少假陽性,即從特征提取主幹的早期尺度中彙集特征,以解決該問題,這允許同時學習與任務無關和與任務相關的特征。

在這裡,我們提出了一個新的端到端架構,稱為NoduleNet,用于聯合解決肺結節候選篩查,減少假陽性和結節分割。 NoduleNet由三部分組成:結節候選篩選,減少假陽性和分割細化(圖1)。 這三個元件共享相同的底層特征提取骨幹網,整個網絡以端到端的方式進行訓練。

每周一篇 文獻閱讀—paper2譯文

圖1:NoduleNet概述。 NoduleNet是肺結節檢測和分割的端到端架構,由三個連續階段組成:結節候選篩選,假陽性減少和分割細化。 k是錨的數量。 FC是完全連接配接層的縮寫。

我們的主要貢獻總結如下:

  • 我們提出了一個統一的模型,在單一架構内內建了結節檢測,減少假陽性和結節分割三個任務,以多任務方式訓練端到端。
  • 我們證明了模型的有效性,與僅用于結節檢測的基線模型相比,結節檢測精度提高了10.27%,并且在Dice-Srensen系數(DSC)上實作了最先進的結節分割精度83.10%)。
  • 我們進行系統消融研究,以驗證NoduleNet的幾個設計技巧的貢獻,包括解耦特征圖,分段細化子網和多任務訓練。

NoduleNet

結節候選篩選(NCS)。為了生成候選結節,将3×3×3 3D卷積層應用于特征圖(圖1中的特征圖4),然後是兩個平行的1×1×1卷積層,以生成分類機率以及與特征圖上每個體素上的每個錨相關聯的六個回歸項。 錨是一個3D框,需要六個參數來指定:中心z-,y-,x-坐标,深度,高度和寬度。 我們選擇了尺寸為5,10,20,30和50的立方體作為這項工作的5個錨點。 然後,我們最小化與[12]相同的多任務丢失函數。

解耦減少假陽性。與[12]中使用相同的特征圖的池化特征進行分類的RPN不同。使用耦合特征圖進行學習可能導緻兩個任務都達不到最優解。相反,我們使用3D感興趣區域(ROI)池化層來從具有小感受野(down 4)的早期特征圖中采集特征。 這不僅確定減少假陽性網絡具有小的感受野,并且可以學習與候選結節篩選網絡顯著不同的特征表示,而且還允許共享一些特征提取塊。 與NCS相同,減少假陽性的網絡最小化損失函數中的多任務。

分割細化(SR)。如圖1所示,分割是在與原始輸入CT圖像相同的比例下進行的,通過逐漸向上采樣裁剪的進階特征圖(特征圖4),并将其與低級語義強特征連接配接起來。

這種方法與[6]中提出的掩模分支有根本的不同。 在[6]中,作者僅使用下采樣的特征圖進行分割,然後将預測的模闆重新調整回原始圖像比例,但是由于邊界框回歸誤差和更精細的局部特征的丢失,精度可能會下降。

另一個優點是,隻有具有結節的區域被上采樣到原始圖像比例,其僅占整個輸入圖像的小區域。 與在[11]中将整個特征圖上采樣到原始輸入比例相比,這節省了大量的GPU記憶體,使得訓練和測試期間輸入整個體素是可行的。

分段細化網絡最小化預測掩模集{m}和輸入圖像的GT掩模集{g}之間的Dice損失。

結果

資料和實驗配置。我們使用LIDC-LDRI [2]來評估NoduleNet的性能。 LIDC-LDRI是一個用于研究肺癌的大型公共資料集,其中包含從多個切片厚度的多個部位收集的1018組CT掃描。 在該資料集中,直徑等于或大于3mm的結節具有由最多四位放射科醫師概述的輪廓。 我們隻包括那些符合LUNA16 [14]選擇标準的CT掃描。 如果由兩個放射科醫師提供的兩個分割掩模具有大于0.4的并集交叉(IoU),則我們認為這兩個掩模指的是相同的結節。 我們認為至少有4名放射科醫師中有3名注射了結節,是以總共進行了586次CT掃描,共有1131個結節。 請注意,由于入選标準不同,本作品中包含的CT掃描和結節數量可能與以前的工作[17,18,1]不同。

采用了六折交叉驗證以證明NoduleNet的性能。 實驗中的所有模型均使用随機梯度下降(SGD)訓練,初始學習率為0.01,動量為0.9,l2罰分為0.0001,為200個時期。 學習率預期在100次疊代後降至0.001,在另外60次疊代後降至0.0001。

采用自由響應接收器工作特性(FROC)[9]分析來評估結節檢測的性能。 我們使用了與LUNA16 [14]相同的命中标準和競争績效名額(CPM)。 聯合交叉(IoU)和Sørensen-Dice系數(DSC)用于評估結節分割的性能。

結節檢測性能。為了完全驗證和了解我們的上述假設,我們使用不同的網絡架構和設計選擇進行了廣泛的實驗。我們使用N1表示僅具有NCS分支的網絡,N2表示同時具有NCS和FPR分支的網絡,并且N3表示具有所有NCS,FPR和SR分支的網絡。 Fc表示建立在與NCS相同的特征映射上的FPR分支,而Fd表示建立在前一節中提到的解耦特征映射上的FPR分支。 R表示訓練資料通過xy平面旋轉進行額外增強。 NCS表示來自NCS分支的預測機率,FPR表示來自FPR分支的預測機率,FU表示來自NCS和FPR的預測機率。請注意,N1是廣泛使用的用于結節檢測的3D RPN [15,16,19,10],它是評估每個添加組分性能的強基線。結果總結在表1中。

每周一篇 文獻閱讀—paper2譯文

LIDC資料集上不同方法基于六折交叉驗證的CPM。 顯示的是結節檢測靈敏度(機關:%),每清單示每次CT掃描的門檻值誤報率(FPs / scan)。 最後一清單示七個預定義FP /掃描門檻值的平均靈敏度。

如表1所示,通過添加分割細化網絡(N3),每個患者的8個假陽性的靈敏度具有1.0%至1.5%的一緻改善,這證明了使用添加額外的結節分割資訊的有效性。

相比使用耦合假陽性的NoduleNet(Fc),使用解耦減少假陽性的NoduleNet(Fd)的平均靈敏度提高了約3%至4%。此外,通過在資料增強(R)中添加旋轉,FPR分支的性能進一步提高了約2.5%,而NCS分支的性能保持幾乎相同。 這驗證了我們的假設,即分類應該學習不變特征,而定位可以學習協變特征。這些發現證明了解耦子產品的重要性,這些子產品本質上是在學習不同的任務。

通過融合NCS和FPR的預測機率,性能持續提高0.7%-1.0%,表明結合來自不同級别的上下文資訊的分支的預測是重要的。 通過增加誤報減少和分割細化網絡,相應地改善了基線檢測器(NCS)的性能,顯示了多任務學習和特征共享的有效性。

總之,NoduleNet的性能優于基線單級探測器的10.27%。 請注意,由于不同的結節選擇标準以及訓練和測試資料分割,LUNA16中報告的性能可能無法與此工作直接比較。 此外,這項工作的重點是結節檢測和分割的聯合學習,而LUNA16隻關注結節檢測。

每周一篇 文獻閱讀—paper2譯文

結節分割性能在表2中,我們将NoduleNet的分割性能與在LIDC資料集上訓練和測試的其他基于深度學習的方法進行了比較[17,18,1]。 NoduleNet在DSC上的表現優于先前基于深度學習的方法0.95%,無需為結節分割訓練單獨的專用3D DCNN。 我們随機選擇了幾個結節來顯示分割品質(圖2)。

結論

在這項工作中,我們提出了一種新的端到端3D DCNN,名為NoduleNet,用于聯合解決肺結節檢測,假陽性減少和分割。 我們進行了系統分析,以驗證架構中每個元件設計背後的假設和直覺。 LIDC資料集的交叉驗證結果表明,我們的模型在結節檢測上獲得了87.27%的最終CPM得分,在結核分割上達到了83.10%的DSC得分,代表了該資料集的目前最新技術水準。 這裡介紹的技術是通用的,可以很容易地轉移到其他模型。

繼續閱讀