天天看點

《Evaluate the Malignancy of Pulmonary Nodules Using the 3D Deep Leaky Noisy-or Network》閱讀筆記(一)《Evaluate the Malignancy of Pulmonary Nodules Using the 3D Deep Leaky Noisy-or Network》閱讀筆記–翻譯及個人了解(一)

《Evaluate the Malignancy of Pulmonary Nodules Using the 3D Deep Leaky Noisy-or Network》閱讀筆記–翻譯及個人了解(一)

論文連結 :https://arxiv.org/pdf/1711.08324.pdf

聲明:作者翻譯論文僅為學習,如有侵權請聯系作者删除博文,謝謝!

摘要

通過計算機斷層掃描(CT)掃描自動診斷肺癌涉及兩個步驟:檢測所有可疑病變(肺結節)并評估整個肺/肺惡性程度。目前,關于第一步的研究很多,而關于第二步的研究很少。由于結核的存在并不能肯定地表明癌症,并且結節的形态與癌症之間存在複雜的關系,是以肺癌的診斷需要對每個可疑結節進行仔細的研究,并綜合所有結節的資訊。我們提出了一個3D深度神經網絡來解決這個問題。該模型包含兩個子產品。第一個是用于結節檢測的3D區域提議網絡,該網絡輸出對象的所有可疑結節。第二個基于檢測置信度選擇前五個結節,評估它們的癌症機率,并将它們與洩漏性的“噪聲門”結合起來,以擷取受試者患肺癌的可能性。這兩個子產品共享相同的骨幹網,即修改後的U-net。通過交替訓練兩個子產品,可以減輕因訓練資料不足而導緻的過拟合問題。提出的模型在2017年Data Science Bowl競賽中獲得第一名。該代碼已公開釋出。

介紹

肺癌是最常見和緻命的惡性惡性良性腫瘤之一。 與其他癌症一樣,肺癌的最佳解決方案是早期診斷和及時治療。 是以,定期檢查是必要的。 體位胸部計算機斷層掃描(CT)是診斷肺癌的常用影像學工具。 根據其對X射線的吸收,可以可視化所有組織。 肺部病變稱為肺結節。 結節通常具有與正常組織相同的吸收水準,但具有獨特的形狀:支氣管和血管是連續的管道系統,在根部較厚,在分支處較薄,結節通常為球形且孤立。 通常,有經驗的醫生大約需要10分鐘才能對患者進行徹底檢查,因為一些小結節很難找到。 此外,結節有許多亞型,不同亞型的癌症機率也不同。 醫生可以根據其形态來評估結節的惡性程度,但是準确度在很大程度上取決于醫生的經驗,不同的醫生可能給出不同的預測。

計算機輔助診斷(CAD)适用于此任務,因為計算機視覺模型可以在相同品質的地方快速掃描,并且不受疲勞和情緒的影響。 深度學習的最新進展使計算機視覺模型能夠幫助醫生診斷各種問題,并且在某些情況下,該模型對醫生表現出競争優勢。

與一般的計算機視覺問題相比,自動肺癌診斷有幾個困難。首先,結節檢測是3D對象檢測問題,比2D對象檢測難。由于GPU記憶體有限,将2D對象檢測方法直接推廣到3D情況面臨技術難題。是以,一些方法使用2D區域提議網絡(RPN)在單個2D圖像中提取propasal,然後将它們組合以生成3D proposal。更重要的是,标注3D資料通常比标注2D資料難得多,這可能會使深度學習模型由于過度拟合而失敗。其次,結節的形狀各不相同(圖1),結節與正常組織之間的差異不明确。結果,在某些情況下,即使是經驗豐富的醫生也無法達成共識。第三,結節與癌症之間的關系很複雜。結節的存在并不一定表示肺癌。對于具有多個結節的患者,應考慮所有結節以推斷出癌症的可能性。換句話說,與經典檢測任務和經典分類任務不同,在此任務中,标簽對應于多個對象。這是一個多執行個體學習(MIL)問題,這是計算機視覺中的一個難題。

為了解決這些困難,我們采取以下政策。我們建立了一個3D RPN 以直接預測結節的邊界框。 3D卷積神經網絡(CNN)結構使網絡能夠捕獲複雜的特征。為了解決GPU記憶體問題,使用了基于patch的教育訓練和測試政策。對該模型進行端到端教育訓練以實作有效的優化。廣泛的資料擴充被用來對抗過度拟合。将檢測器的門檻值設定得較低,以便包括所有可疑結節。然後,選擇前五個可疑結節作為分類器的輸入。分類器中引入了洩漏噪聲或模型,以合并前五個結核的得分。

噪聲或模型是機率圖模型中常用的局部因果機率模型。它假定一個事件可能是由不同的因素引起的,并且這些因素中任何一個的發生都可以導緻事件的發生具有獨立的機率。該模型的一種修改版本稱為“洩漏噪聲或模型” ,它假設即使沒有任何因素發生,事件也存在洩漏的可能性。洩漏噪聲或模型适用于此任務。首先,當一個病例中存在多個結核時,所有結核都有助于最終預測。其次,高度可疑的結節将解釋癌症病例,這是可取的。第三,當無結節可以解釋癌症病例時,癌症可以歸因于洩漏的可能性。

分類網絡也是3D神經網絡。為了防止過度拟合,我們讓分類網絡共享檢測網絡的主幹(捆綁兩個網絡的主幹的參數)并交替訓練兩個網絡。還使用了廣泛的資料擴充。我們對這項工作的貢獻總結如下:

1)據我們所知,我們提出了用于3D對象檢測的第一個容積式單級端到端CNN。

2)我們建議将噪聲或門內建到神經網絡中,以解決CAD中的多執行個體學習任務。

我們在資料科學碗20172上驗證了所提出的方法,并在1972個團隊中獲得第一名。

本文的其餘部分安排如下。 第二節介紹了一些密切相關的作品。 後續部分将詳細介紹該方法的流程。 它包括三個步驟:(1)預處理(第三節):将肺從其他組織中分離出來; (2)檢測(第四節):發現肺中所有可疑結節; (3)分類(第五節):對所有結節進行評分,并結合其癌變機率,以獲得患者的總體癌變機率。 第一步是通過經典的圖像預處理技術完成的,其他兩個步驟是通過神經網絡完成的。 結果在第六節中給出。 第七節對本文進行了一些讨論。

《Evaluate the Malignancy of Pulmonary Nodules Using the 3D Deep Leaky Noisy-or Network》閱讀筆記(一)《Evaluate the Malignancy of Pulmonary Nodules Using the 3D Deep Leaky Noisy-or Network》閱讀筆記–翻譯及個人了解(一)

相關工作

A.一般物體檢測

已經提出了許多物體檢測方法,全面的審查超出了本文的範圍。這些方法大多數都設計用于2D對象檢測。一些最先進的方法有兩個階段(如fast - rcnn[12]),在第一階段提出一些邊界框(稱為proposals)(是否包含一個對象),在第二階段做出類決策(提案中的對象屬于哪個類)。較新的方法隻有一個階段,即同時預測邊界框和類别機率(YOLO [14]),或者沒有生成建議的預設框的類機率被預測(SSD[15])。通常,單階段方法更快,但兩階段方法更準确。在單類對象檢測的情況下,不再需要兩階段方法中的第二階段,并且這些方法會退化為單階段方法。

限制了将前沿的2D對象檢測方法擴充到3D對象檢測任務(例如,視訊中的動作檢測和體積檢測)。由于主流GPU的記憶體限制,一些研究使用2D RPN提取單個2D圖像中的propasal,然後使用額外的子產品将2D propasal合并為3D propasals[8,9]。類似的政策已經用于3D圖像分割[16]。據我們所知,尚未使用3D RPN處理視訊或體積資料。

B.結節檢測

結節檢測是典型的體積檢測任務。由于其巨大的臨床意義,近年來受到越來越多的關注。該任務通常分為兩個子任務:提出propasals和減少假陽性,每個子任務吸引了許多研究。通常,第一個子任務的模型以簡單,快速的3D描述符開始,然後是分類器,以給出許多proposals。第二個子任務的模型通常是複雜的分類器。在2010年,Van Ginneken等人。 [17]給出了對六種正常算法的全面綜述,并在ANODE09資料集上對其進行了評估,該資料集包含55次掃描。在2011-2015年期間,開發了更大的資料集LIDC [18、19、20]。研究人員開始采用CNN來減少誤報的數量。 Setio等。 [21]采用了多視圖CNN,Dou等人。 [22]采用了3D CNN來解決此問題,并且均比傳統方法獲得了更好的結果。Ding等。 [9]采用2D RPN在每個切片中提出結核建議,并采用3D CNN減少假陽性樣本的數量。一場名為“2016年肺結節分析(LUNA16)[23]”的比賽在標明的LIDC子集的基礎上舉行。在本次比賽的檢測軌迹中,大多數參與者使用了兩階段方法[23]。

C.多執行個體學習

在MIL任務中,輸入是一包執行個體。如果将任意執行個體标記為正,則将袋子标記為正,如果将所有執行個體标記為負,則将袋子标記為負。

許多醫學圖像分析任務是MIL任務,是以在深度學習興起之前,一些早期的工作已經提出了CAD中的MIL架構。 Dundar等。 [24]引入凸包來代表多執行個體特征,并将其應用于肺栓塞和結腸癌的檢測。Xu等。 [25]從組織檢查圖像中提取了許多更新檔,并将它們視為多執行個體,以解決結腸癌分類問題。

為了将MIL內建到深度神經網絡架構中,關鍵元件是将來自不同執行個體的資訊組合在一起的一層,稱為MIL Pooling Layer(MPL [26])。一些MPL例子是:最大池化層[27],均值池化層[26],對數和指數池化層[28],廣義均值層[25]和噪聲或層[29]。如果每個樣本的執行個體數是固定的,則将特征級聯用作MPL也是可行的[30]。 MPL可用于在功能級别[27、28]或輸出級别[29]中組合不同的執行個體。

D.噪聲或模型

噪聲或貝葉斯模型被廣泛用于推斷諸如肝髒疾病[31]和哮喘病例[32]等疾病的可能性。 Heckerman [33]建立了一個基于“噪聲或門”的多特征,多疾病的診斷系統。 Halpern和Sontag [34]提出了一種基于noisy-or模型的無監督學習方法,并在快速醫學參考模型中對其進行了驗證。

上面提到的所有研究都将噪聲模型納入了貝葉斯模型。 然而,“噪聲或模型”與神經網絡的內建很少。 Sun等。 [29]在深度神經網絡架構中将其用作MPL,以提高圖像分類的準确性。 張等。 [35]使用它作為提高物體檢測精度的增強方法。