天天看點

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

醫療影像資料快速增長,引入人工智能技術成必然

人工智能和醫療影像的結合已經成為一個比較熱門的研究和創業方向。除了以深度學習技術驅動的計算機圖像識别能力的大幅提升之外,醫療影像資料的快速增長也是重要原因。

醫療大資料中有超過 80 % 的資料來自于醫療影像。這些資料大多要進行人工分析。目前我國醫學影像資料的年增長率約為30%,而放射科醫師數量的年增長率約為 6.1%,其間的差距是 23.9%,放射科醫師的數量增長遠不及影像資料的增長。這意味着放射科醫師在未來處理影像資料的壓力會越來越大,甚至遠遠超過負荷。

同時,醫療影像的多樣性也在不斷增強,已經從常見的以灰階為主的 x 光片、ct、 mri、b 超等發展到結合了其他動力學、醫學解剖學等特征的計算機合成的彩色、多元影像圖檔,以及各種數字檢查鏡産生高分辨率圖像,如眼底照片、病理圖像等等,以及在影像以外再加上治療資料、基因資料、預後資料以及影像時間次元的擴充等結合,多模态影像、病理、檢驗、基因及随訪資訊等資料的種類繁多。

然而長期以來,人工鑒别圖像幾乎是醫療機構唯一在使用的方式,對醫師的經驗、狀态都有着極大的依賴,加之人眼的分辨率和敏感度限制,客觀上制約了對影像資料的充分利用。影像科醫師較長的培養周期,也對基層醫療機構承擔起分級診療政策指導下的疾病初診都造成了一定壓力。

當然,也要看到,盡管資料量如此巨大,且多樣性極強,但因為醫療影像資料的标準化、結構化和統一性在整個醫療資料中仍然是最強的,再加之以深度學習技術驅動的圖像識别本就處在這一波 ai 技術應用浪潮的最前沿,這使得醫療影像智能分析在智能醫療各領域中都屬于發展較快的一支。國内外湧現了一批将 ai 技術應用于醫療影像識别和分析的初創公司。然而,在具體的技術落地過程中,這些公司往往會遇到一些特定的難題。

在此,我們和大家分享一個在英特爾技術支援下,由浙江大學數理學院和浙江德尚韻興圖像科技有限公司成功開發的智能醫療影像診斷系統的案例。該系統的任務是識别和分析影像中的甲狀腺結節以及良惡性。根據實測,國内比較頂級的三甲醫院 10 年資質的放射科醫生判斷準确性平均在 75% 左右,而目前雙方合作開發出的系統-de 超聲機器人的準确率則能穩定在 85% 以上,在實驗室則達到 90% 以上。并在包括浙江大學第一附屬醫院的醫療機構已經實際應用,服務了幾千名患甲狀腺結節的病人。

de 超聲機器人的用途、優勢和價值

 浙江大學數理學院和德尚韻興公司的聯合開發團隊針對目前人群中高發的甲狀腺結節的智能讀片和分析需求,研發了基于深度卷積網絡 dnn 的算法,可對超聲醫學圖像病變區域進行識别和判斷。深度學習可以模仿人腦的機制來提取醫學影像的特征,形成更加抽象的高層特征來進行分類或識别物體。傳統的機器學習方法是由專業人員來定義結節或惡性良性腫瘤的特征,如鈣化、邊緣、毛刺、灰階等,利用特征組合來表示目标屬性或類别。由于影響因素十分複雜,人工定義特征難度高而且效果也比較有限。深度學習能自動學習具有層次結構的特征,如淺層次特征:邊緣、灰階、角、回聲、鈣化、形狀等; 深層次特征:複雜紋理。通過特征學習準确的實作對目标的識别和分類。同時,結合分割技術、檢測與識别技術,通過來自大量不同醫院、不同品牌、不同型号的超聲機采集的超聲影像資料來訓練網絡結構,開發出了超聲醫學影像智能診斷系統——de 超聲機器人。

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

功能說明:

功能一:甲狀腺結節探測與識别

無需醫生幹預,便可從原始的甲狀腺超聲圖檔中快速地勾畫出所有結節的輪廓。

功能二:甲狀腺結節良、惡性診斷

對超聲圖檔中每個結節分别自動、快速地診斷其良、 惡性。

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇
從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

為了更好的驗證 de 超聲機器人對醫生診斷的支援效果,研究團隊與某國内排名前十的三甲醫院超聲科進行了讀片對比,分别遴選出十年資和兩年資以上的超聲醫生與de 超聲機器人的讀片結果進行比對,以病理報告的結果(金标準)為依據。競賽結果表明,資深超聲醫生的識别準确率平均約為75%, 而超聲機器人則穩定在 85% 以上。

開發過程中的挑戰,及基于英特爾領先ai技術的解決方案

在研發過程中,研發團隊遇到了如下挑戰:

1. 原有訓練平台使用了 gpgpu 産品,片上記憶體僅有 8gb,而每次訓練需要導入記憶體的資料超過 12gb, 經過大量重新設計網絡、優化計算架構、壓縮資料集等方法,将記憶體需求降低到 6gb,但是最終的效果受到了影響。

2. 最初設計了工作站和雲版兩種部署模式,并實作了工作站平台版本,但未能應用 mkl 加速,單張影像分析時間較長,為後續處理連續 b 超影像帶來性能瓶頸。雲版需要考慮多使用者管理并且在結合醫療機構正常甲狀腺管理方面做好整合,工作量較大一直沒有開始。

3. 在甲狀腺 b 超取得顯著進展的同時,也開始了乳腺 癌、腹部 b 超、頸動脈斑塊等其他方向的研究,原平台最多 4 卡限制了研究效率。

英特爾與浙江大學數理學院、德尚韻興公司一起實作了以下重要進展:

1. 共同将模型訓練從 gpu 四卡系統遷移至 intel xeon phi 7250 四節點平台,經過優化單節點性能約為元平台處理速度的1.1 倍。

2. 共同将預測模型用英特爾的 mkl2017 優化,在 cpu 平台 的評分速度預計獲得 8x 以上提升。

3. 共同改進算法準确度,進一步提高圖像識别的精度。

4. 引入英特爾醫療生态鍊合作夥伴經綸世紀,共同将基于單機的 de 診斷系統更新為雲服務方案,并部署在阿裡雲平台,支援在浙大醫院超聲科的實時業務。

5. 與經綸世紀依照美國甲狀腺協會指南的甲狀腺風險度評估與管理系統內建,并成功推廣到面向 2000 萬人口的中國健康促進基金會全國篩查項目。

英特爾人工智能系統化解決方案

圖四:深度學習步驟示意圖

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

英特爾秉承人工智能大衆化的理念,緻力于不斷推出易于部署和開發,高效能的深度學習平台。英特爾的深度學習體系分别對針對訓練和評測兩個環節進行了優化,共享共同的基礎架構和開發環境,使得開發、維護、代碼複用等大大簡化。

圖五:英特爾深度學習系統化解決方案

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

英特爾深度學習訓練伺服器

英特爾的深度學習平台可以基于 xeon 或者 xeon phi 衆核處理器來建構。其内置了諸多子產品,使開發者進行機器學習開發更加容易。英特爾開發了深度學習加速函數加強它廣泛應用的 mkl (math kernellibrary)數 學 庫,并通過 daal (data analytics acceleration library) 資料分析加速函數庫提供 分布式機器學習功能,它對基于 ia 的硬體平台進行了深度優化。這兩個庫都可以通過“社群許可”免費獲得。

英特爾還提供了基于 intel xeon 處理器和 intel xeon phi 處理器的 caffe,theano,tensorflow 等深度學習主流架構的優化整合包(caffe optimized integration for intel xeon 和 intel xeon phi)。英特爾全路徑架構(intel opa,intel omni-path architecture)和 xeon phi knights landing 處理器支援超高速互聯計算節點叢集。新的智能方法,可以将深度神經網絡訓練擴充到大量處理節點上,進而在目前最優的基礎上顯著減少了訓練時間。例如,使overfeat-fast 深度神經網絡拓撲結構,已經有研究機構在目前 64 個節點的 intel xeon e5-2697 處理器上将訓練時間降低到了 8 小時,使用knights landing 平台會将時間降低到 3-4 個小時。

基于 xeon phi 衆核處理器的訓練伺服器可以克服片上記憶體對計算規模和網絡深度的限制,并且作為自啟動處理器,可以直接通路主存,顯著提高計算效率。當搭建大規模的訓練叢集時,128個節點的 xeon phi 可以達到 50倍以上的速度提升。

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

浙大數理學院最早選擇了 convnet 在 gpu 平台上進行模型訓練,因為大量 b 超影像的資料對記憶體要求較 高,他們在 convnet 上做了深入優化和壓縮使對記憶體的占用從 12g 降低到 6g,使得算法得以運作完成, 但是對精确度和計算效率都造成了一定的影響。轉入 xeon phi 平台後,記憶體的限制被移除,除了處理器帶有高達 16g 的片上記憶體,單個節點可直接通路的主存空間也高達 384g。

研究團隊采用了如下配置的 xeon phi 的訓練伺服器:

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

在單個節點 xeon phi 平台使用 intelcaffe 以及 mkl2017 的最新版本,經過調優後,速度提高到2 倍,在 resnet101 和 resnet50 的測試中,甚至達到對比組 m40 的性能的 1.2 倍。

英特爾人工智能評分系統加速方案

浙江大學數理學院和德尚韻興公司的聯合開發團隊初期為了将在gpgpu 上訓練好的模型部署于工作站或者雲端,基本上重新編寫了全部實作代碼,并且進行了深度優化,單幅圖像的處理時間一直在30 秒左右。這在開始階段可以接受,但是 b 超本身産生的是連續圖像,這使得連續處理時間幾十倍的增加,并且增加了其他病種後時間會變得更長,産品化和商業化的時間都受到影響。

聯合開發團隊裝了數學核心庫的最新優化版本 mkl2017 以 後,打開并行化選項,在不改變代碼的情況下就已經獲得 2 倍以上的速度提升,經過深度優化,速度提高到 10 倍左右。這些優化由于得到基于統一的 ia 架構 的支援,無論是在工作站方案,還是雲版方案,都同樣得到了效能的顯著提升。

與此同時,雲服務商将 mkl 部署于其計算環境,即可對其客戶的應用進行加速。

“隻要是計算,英特爾就是最好的”。英特爾醫療與生命科學集團亞太總經理李亞東如是說。

與生态系統合作夥伴一起發揮 de 超聲機器人的應用價值

英特爾積極聯合生态環境産業合作夥伴,推動人工智能研發成果産品化,探索有效的業務模式,為行業提供從方案架構到業務流程的參考案例。

在浙大醫學院附屬第一醫院超聲科的部署,得到了幾位主任的高度評價與支援。超聲機器人作為初步的篩查工具,可以避免醫生花費大量時間檢視比較簡單的圖像,集中精力于複雜案例,也可以有效的降低漏診、誤診等問題。蔣主任介紹說,超聲科的醫生工作負擔非常重,每天可能要書寫數百份超聲報告,很多雖然基本但是很耗費時間,經過長時間的工作,醫生的準确率可能會受到影響。引入超聲機器人作為助手,醫生隻需要複核,經過标注的可疑區域也非常直覺,提高了效率,作為培養年輕醫師的手段也很受歡迎。

位于杭州的另外兩所社群衛生院基于阿裡雲部署的超聲機器人,也深受當地醫生患者好評。之前由于基層的醫生經驗有限,很難及時給出報告,現在隻需要數秒,超聲機器人就可以自動生成一份詳細的參考報告模闆。既可以全自動地探測結節區域、識别結節的良惡性,也可以通過人工勾畫出結節區域,然後系統自動識别其良惡性。

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

英特爾與醫療機構一起推進先進技術在的普及和應用, 惠及更大量人群,參與到中國健康促進基金會的全國甲狀腺結節檢查與風險度評估項目,并與執行機關經綸世紀一起與超聲機器人緊密內建,并利用阿裡雲的覆寫網絡和線上存儲服務,将業務應用推廣到數百家體檢中心,将會覆寫每年參檢的 2000 多萬人群。

在以往人工智能線上服務模式中,作為服務提供方的機構往往會遇到雲服務公司的平台對人工智能算法的支援較弱,關鍵算法需要重新設計,加速卡等方案昂貴而且由于雲服務公司的平台管理機制無法使用,造成無論是線上性能、優化、維護成本都不夠理想。

阿裡雲将對人工智能應用的平台化支援作為重要的建設 目 标,與英特爾緊密合作,從 通用計算硬體(xeon,xeon phi 等)選型到計算加速庫、大資料分析加速工具的整合與優化做了大量工作,并且通過一系列安全強化措施增強了使用者對資料上雲的信心。最 終線上版本的計算效能較為理想,直接将在本地優化好的應用遷移到雲的過程很平滑,最終使用者(超聲科醫生)的回報也對響應和計算速度滿意。在 2000 萬人群的全國篩查項目中,集中體檢對線上平台的壓力較大,高峰時期可以達到 300-500 例并發線上評分診斷,而響應時間并沒有顯著延長。

從英特爾支援DE超聲機器人開發,看人工智能在醫療影像領域的價值和機遇

英特爾與合作夥伴在人工智能在醫學影像的開發和應用的探索實踐,為将來引入更多病種的檢測與診斷,充分發揮人工智能在影像識别的獨特優勢,提高診斷的品質和效率,起到了非常有效的推動。而英特爾系統化的計算硬體和所支援的豐富的計算結構和架構,則為開發者快速開發提供了有力武器,并且與其生态環境合作夥伴密切配合,為技術的普及和業務模式的發展提供了強力支援。

繼續閱讀