AI用于醫學影像，你需要知道這些 | 硬創公開課

本期硬創公開課，雷鋒網請到其中一家公司deepcare的創始人兼cto丁鵬博士，為我們講講人工智能應用于醫學影像的那些事兒。

丁鵬，deepcare創始人兼cto，博士畢業于美國達特茅斯學院(dartmouth

college)，從事算法研發工作8年；在計算機視覺和深度學習技術方面有長時間的科研經曆，且有工業級算法開發經驗；對人工智能技術産業化有深刻的見解，在如何将人工智能技術與醫學影像結合，開發商業産品方面，也是國内首屈一指的專家。

以下内容來自丁鵬在雷鋒網硬創公開課的分享：

雷鋒網：可以簡單介紹一下deepcare所關注的領域嗎？

我們主要的方向是醫學影像。醫學影像是一個很大的方向，從細胞病理學到組織病理學到影像科，都屬于這一範圍。我們經過調研，确定做的是病理方向。原因是，病理醫生是“醫生中的醫生”，地位非常重要，是确定有沒有重大疾病（如癌症）的最後一道防線，而國内的病理醫生又是奇缺的，存在很大的供需沖突。

我們的定位是，為病理醫生提供服務，提升他們的工作效率，幫助他們看片。一個方面是“查”，一個方面是“判”。查主要是指針對病理科的搜尋、資料管理系統等，如以圖搜圖。二是判，指幫助病理醫生看片子。目前主要是做乳腺和肺癌。

雷鋒網：總體上看，把計算機視覺等人工智能技術用在醫療上，在國内目前的發展，處于什麼樣的階段？

對于這個問題，要先看看深度學習等新技術，用在傳統行業上（比如醫生看病）的意義有哪些。無論在發達國家還是開發中國家，優質醫療資源的供需始終是一對沖突，因為巨大的人口壓力，這個問題在中國尤為突出。這也是為什麼在協和醫院門口是看到那麼多外地人到北京看病，又挂不上專家号隻能買黃牛票。

另一方面來說，醫學影像是醫生看病，及決策的最大的資訊入口。而醫生了解這些影像的本質，即是醫生大腦經過長期的過程被大量資料訓練出來的結果。一個客觀事實是，高中低年資的醫生在看同一張片子時候，得出的結論會有天壤之别，這也是為什麼我們要去協和找“老大夫”看病的事實依據。

這是因為看病的效果和從醫的年限高度相關，而從醫的時間長短不同意味着所接受的資訊量不同。那麼如果一台機器學習了比人類醫生多得多的案例或者圖檔，會不會超越人類呢？答案一定是肯定得。這也是應用深度學習技術訓練計算機“看懂”醫學影像的意義所在。

對于發展狀況，我看來，無論在中國還是美國，在算法和資料上看，這一領域的發展都是在早期。它已經走出了實驗室，但離商業化還有很長的路要走。

算法開發上，通用物體檢測識别的算法又一個巨大的人群在做，但是在醫學影像領域由于資料的可獲得性差很多，是以研究的人和前者相比并不是特别多。但是越來越多的學者和研究機構看好這個方向，開始加大投入進來。

高品質的标注資料方面，在這個方面中國與美國相比很有可能會“彎道超車”，因為我們都知道在美國拿醫療資料是個非常困難的事情，無論是科研還是商用；但是在中國因為體制的原因和政府對于技術創新的重視，會讓這個問題變得更容易一些。

雷鋒網：根據你們的經驗将人工智能用于醫療，會面臨哪些主要困難和阻礙？

人工智能或者說深度學習相對來說是一個新技術，一個新的技術與老的行業相結合的時候往往會誕生出新的方向。目前的人工智能技術無論與哪一個行業結合，都必須聚焦到一個“場景”上來，比如說“醫生讀片”就是一個場景。在這個場景上應用新技術，特别是對于二三線城市中受訓練較少的醫生，不僅會提高醫生判定的準确性，更會提高醫生的工作效率，換句話說，釋放了醫生的生産力。

要完成這個事情，需要有兩個必要條件。第一，适應于具體問題的算法；第二，高品質的标注資料。算法開發是一個難點，但相對比較容易搞定。高品質的小批量标注資料我們也已經獲得，但是如何進行大批量資料的标注，以及标注品質控制确實是一個比較困難的問題。這涉及到最核心的資源，即高品質醫生的時間與效率。除了時間，更重要的是如何做品質管控，比如同樣一張圖，标準及答案是什麼，誰定義答案，由幾個醫生來标注，标注的是幾個階段，是盲标還是非盲标。這些都是要考慮的。

這個問題業界目前還沒有給出一個清晰标準的答案，正在積極探索。

雷鋒網：在技術選擇上，醫學影像與其它圖像識别是否會存在差異？

這是必然的。自然世界裡的圖像與人體内的圖像有着天然的巨大差異，是以針對于不同問題我們使用的算法也是不一樣的，絕對不可能一刀切。我之前做過一種醫學影像，它的病變的位置（做的是分割問題）有從十幾個像素到幾千個像素，為了檢測小的病變點，如果downsampling次數太多，可能無法deconvelotion回來。

雷鋒網：主要會用到哪些技術和算法呢？

在cv上有三個最基本問題：分類，檢測和分割。我們處理的問題中也用的這三種方法，在病理上主要是做細胞層面上的，比如分類，細胞的分割，在細胞病理學上的檢測工作等。

雷鋒網：深度學習等技術是否适合所有類别的醫學影像，是否有些更為合适？

将深度學習技術應用在計算機圖像上的時候，有一個衡量問題難易程度的“标準”，即這個問題（圖像）讓人來了解的話是否可以做到。從我的經驗來看，一個人普通人（比如我自己）經過簡單的訓練（比如一個小時左右）之後就可以在化驗血液的圖檔中找到紅細胞、白細胞等等；但是我需要經過很多次高強度的訓練之後，才有可能在肺部組織病理切片中看出，哪裡是癌細胞以及它們對應的亞型是什麼。

從這個角度來看，我們做的了解組織病理切片的問題，應該是屬于醫學影像中非常難的問題之一。對醫生難，是以對機器也不容易，但正是它的困難才帶來了無與倫比的價值，是以病理科醫生在被稱為“醫生中的醫生”。病理科相當于，如果判斷一個人是否有癌症，影像科所得的影像都不能據此下最後的結論，而病理醫生可以下結論。

有幾個數字，國内病理科醫生在冊的有1萬多人，但經過我們的訪談，認為國内需要大約6、7萬的人才能滿足需求。但病理醫生的培養周期特别長，北京某著名醫生的病理科主任曾跟我說過，他們醫院45歲以下的病理科醫生會診時沒有發言權。因為細胞本身的差異非常大，醫生也就要經過大量的訓練才行。

由于體制的原因，病理科醫生不直接面對患者，收入水準較低。幾家特甲醫院也需要花大價錢尋找病理醫生。這種供需沖突也帶來了巨大的機會，這不僅是商業上的，也是有社會意義的。

雷鋒網：資料對人工智能來說很重要，那醫學影像的資料來源及擷取管道有哪些？

資料的來源的主體還是醫院，不過目前越來越多的第三方病理中心也是我們擷取資料的管道之一。

雷鋒網：資料建設是一個難點嗎？标注上是否會有更多困難？

資料标注甚至比資料擷取更重要。之前我們做過一個非常有意義的研究，找來了40張乳腺癌的病理切片，分别讓中國的高年資和中低年資的醫生标注，并和美國醫生标注的“真值”做比較，結果是我們看到了恐怖的差異：在這40張片子上，進階醫生和普通醫生的水準差距在30個百分點。這個實驗充分說明了找到領域内最厲害的醫生進行标注是多麼的至關重要。

雷鋒網：圖像識别是否可以同時識别出多個部位的疾病？這裡的難點又在哪？

醫學影像是醫生看病一個最大的資訊入口。一張病理切片大概是1-3個g不等，比一個高清電影還大，其中蘊含的資訊也是海量的。是以可以說，從一種重大疾病（比如癌症）的篩查，到随診，再到最後的判定，醫學影像都在其中起到最重要的作用。

對于識别多個部位的疾病，現在是可以查出多種疾病來的，同時，針對某一種病做到知名醫生的水準仍舊不容易。看病是一個過程，目前來看，算法的開發還是針對某一種器官，某一種病。如上所述，整個行業是在早期階段，目前的做法是個個擊破，比如肺部的病變就有很多種，現在的做法是分開進行。合并也是有方法的，比如有檢測多種病的算法，挨個都試試，看效果如何。

但目前來說，能做好一種病的分析就很不容易。比如肺小結節在ct中的檢測，8mm以上的結節已經有團隊可以做到99%的檢測水準，但5mm左右的檢測仍非常難。是以，在評測這些算法時，也要有一個公正的方法。

雷鋒網(公衆号：雷鋒網)：醫學影像與病例病史等資料的整合，進而做出綜合的智能分析，現在處于怎麼樣的階段了？

在我看來，病例方面關于文本的處理是走在影像的前面。目前我了解，這兩個方面仍在獨立進行，都不容易做好。回到資料源上來，在病例本身上，不同醫院，甚至一家醫院不同科室的醫生，寫病例的方式也不一樣，它不是一個結構化的資料來源。

醫生寫病例時，是一種總結的方式，而不是一種連續的方式。比如，醫生與病人交流時，它像一個分類器一樣，問一個問題，然後得到病人的回答，然後再往下問，如果能抽象出來，就像一個樹狀分類器。但病例隻寫了一個分類器的結果，其中判斷的過程并沒有在病例中展現出來。

如果能讓病例資訊更全面，更結構化，這種資訊才能真正利用起來。這也是我們選影像切入的原因，因為影像是更結構化的資訊，以病理科為例，95%的判斷仍是影像中細胞本身的判斷。總體來說，影像與病例這種多模态的資訊的融合是一個方向，但兩者都是在早期階段。

雷鋒網：圖像識别類公司一般有提供api，或自己做硬體，以及做整套方案等區分，在醫學影像上，會更适合哪一類嗎？你們的選擇是怎麼樣的？

這是一個産品形态問題。我覺得無論是雲端産品，還是前端硬體的方式都是可以的，主要看客戶（比如醫院）的需求，以及自身的網絡限制，需要具體問題具體分析。

第三方影像中心有很多，他們的做法是将資料連到雲端。但病理可能是另外一種情況，一張圖可能是1-3gb，這樣會受到醫院帶寬的限制，這種情況下可能是一種前端産品。以血液檢測科為例，有國外的機器自身帶有智能分析算法，做到了前端，最後需要的是醫生确認。

商業路徑選擇要根據不同影像的特點來選擇産品形态。

本文作者：張馳

AI用于醫學影像，你需要知道這些 | 硬創公開課

繼續閱讀

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希