天天看點

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

2017年4月,Hinton在接受《紐約客》采訪時說:“作為放射科醫生你就像卡通裡的歪心狼一樣,你已經沖出懸崖很遠,但還沒有往下看,實際上你的腳下空空如也。”商用的深度學習乳腺癌檢測系統已經在開發中,Hinton說:“很顯然,5年内深度學習就能超過放射科醫生,或許會用10年,我在醫院裡說過,結果反響很糟糕。”

實際上,Hinton在醫院裡說的是,“應該從現在起就停止教育訓練放射科醫生”。

Hinton告訴《紐約客》記者:“放射科醫生的角色從做感覺(perceptual)的事情演變而來,這可能由一隻訓練有素的鴿子完成。”Hinton對自動化醫學未來的預測建立在一個簡單的原則基礎之上:“在有大量資料的地方,采取舊的分類問題,這将通過深度學習來解決。将有數以千計的深度學習應用。”

Hinton希望使用學習算法來讀取各種X射線,CT掃描和MRI資料,這正是他認為的近期前景。

将來,“學習算法會做出病理診斷”,可能是讀取巴氏塗片、聽心音,或預測精神病患者的複發。

AI可以幫助醫生、護士,減少他們的工作量。人類往往無法長時間處理大量的掃描影像和醫療資料,這導緻有時候病變會被看漏,或者過了很久之後才被發現,AI正好可以解決這個問題,極有希望在不久的将來,在醫療領域掀起又一次技術革命。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

肺炎:斯坦福大學的算法診斷肺炎好于醫生

去年9月,美國國家衛生研究院曾釋出一組資料,這給斯坦福大學教授吳恩達上司機器學習小組帶來了啟發。該組資料包含112,120個胸部X射線圖像,标有14種不同的可能的診斷,以及一些初步的算法。研究人員要求四名斯坦福放射科醫師對420張圖像進行注釋,以查找可能的肺炎迹象。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

在一個星期内,斯坦福大學研究人員開發了一種名為CheXnet的算法,它能夠比以前的算法更準确地發現原始資料集中的14種病理學中的10種。在經過大約一個月的訓練之後,研究人員通過康奈爾大學圖書館發表的一篇論文中報告說,CheXnet比四位斯坦福放射科醫師更能準确診斷肺炎。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

在420張X光片上進行測試的ChexNet在靈敏度(正确識别陽性)和特異性(正确識别陰性)方面優于四名放射科醫師。個人放射科醫師用橙色X表示,他們的平均表現用綠色X表示,ChexNet用藍色曲線表示。

斯坦福大學還建立了胸部X射線的熱圖,顔色代表最可能代表肺炎的圖像區域,研究人員認為CheXnet可以極大地幫助人類放射科醫生的工具。

AI比醫生的标準方法更準确地預測心髒病發作和中風

目前而言,評估患者風險的标準方法依賴于美國心髒協會和美國心髒病學會制定的指南。醫生使用這些指導方針,重點關注諸如高血壓、膽固醇、年齡、吸煙和糖尿病等完善的風險因素,為他們的病人制定咨詢和治療方案。

英國諾丁漢大學的研究人員建立了一個AI系統,可以掃描病人的正常醫療資料,并預測哪些人在10年内會發生心髒病或中風。與标準預測方法相比,AI系統正确預測了355名患者的命運。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

為了使系統做得更好,研究人員Stephen Weng及其同僚為英國378256名病人測試了幾種機器學習工具。這些記錄追蹤了2005年至2015年的患者及其健康狀況,并包含了人口統計,醫療狀況,處方藥,醫院通路,實驗室結果等資訊。

研究人員将75%的病曆記錄下來,并将其輸入到機器學習模型中,以找出在10年内發生心髒病或中風的患者的顯着特征。然後Weng的小組測試了另外25%的記錄中的模型,看他們如何準确地預測心髒病發作和中風。他們還測試了該部分記錄的标準指南。

如果使用1.0分表示100%的準确性,那麼标準指導得分0.728,機器學習模型的範圍從0.745到0.764,最好的分數來自一種稱為神經網絡的機器學習模型。

雖然機器評分聽起來可能不是一個響亮的勝利,但當翻譯成人類術語時,其意義就變得清晰了:神經網絡模型預測,在7404例實際病例中,有4998例患者心髒病發作或中風,這超過标準355例方法。有了這些預測,醫生可以采取預防措施,例如開藥降低膽固醇。

自閉症:AI掃描嬰兒腦部以預測自閉症

北卡羅來納大學教堂山分校的一個研究小組發現了6個月大兒童大腦的變化與自閉症的關系,而深度學習算法能夠使用資料,預測在24個月時自閉症高危兒童是否會被診斷為病症。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

該算法正确地預測了高危兒童的最終診斷,準确率為81%,靈敏度為88%。與行為問卷相比算法的表現不錯,因為問卷産生早期的自閉症診斷準确率隻有50%。

這個研究小組的項目是由美國國家衛生研究院資助,項目招募了106名患有自閉症家族史的嬰兒和42名無自閉症家族史的嬰兒,并在孩子們6、12、24個月時掃描他們的大腦。算法僅使用三個變量 —— 腦表面積、腦容量和性别(男孩比女孩更可能有自閉症),算法确定了十個自閉症孩子中的八個。

研究人員發現,在6個月和12個月之間,嬰兒的整體腦部發育沒有任何變化,但後來被診斷為自閉症的高危兒童的腦表面積顯着增加。表面積的增加與12至24個月之間發生的腦容量增長有關。換言之,在自閉症中,發育中的大腦首先在表面積上擴充了12個月,然後在整個體積中增加了24個月。

這個團隊還在24個月的時候對孩子進行了行為評估,當時他們已經夠大了,開始表現出自閉症的标志性行為,比如缺乏社會興趣,語言延遲和重複的身體動作。研究人員指出,大腦過度生長越多,孩子的自閉症症狀就越嚴重。

皮肉切割手術精準度,機器人擊敗了外科醫生

在最近的一系列實驗中,智能自主機器人STAR的發明者表明,它能比專家外科醫生執行更精确的切割,并且對周圍健康組織傷害更小。

STAR通過視覺追蹤其預定的切割路徑,切割工具并不斷調整其計劃以适應自身移動,最終完成工作。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

對于這種視覺追蹤,機器人依賴于研究人員事先在組織上放置的微小标記,這些标記顯示在近紅外錄影機上。研究人員是以将STAR稱為半自主機器人。

機器人和外科醫生都被要求切割直線5厘米的線。由于外科醫生訓練在已知标志之間切割組織,而不是切斷絕對距離,是以在皮膚上繪制參考線。一些外科醫生在開放式手術設定下進行了切割,而另一些外科醫生進行了腹腔鏡設定,這是日益普遍的手術操作,其中工具通過一個小孔插入。

機器人和人類都是根據它們偏離理想長度的理想切割線以及包圍切口多少焦炭(受損的肉)來判斷的。結果:STAR的切割長度接近5厘米,與理想的切割線偏離較少,并且導緻焦點較少。

深度學習能幫助臨床醫生預測阿爾茨海默病(老年癡呆)嗎?

阿爾茨海默病沒有臨床試驗,是以醫生通過評估患者的認知能力下降來診斷。但對于輕度認知功能障礙(MCI)的診斷特别困難,即症狀不明顯的早期癡呆階段。而且更難預測哪些MCI患者會發展為阿爾茨海默病。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

目前,哈佛大學上司的研究小組率先嘗試将fMRI掃描和深度學習結合到一個能預測MCI患者發展為阿爾茨海默病的概覽的項目中。靜息時對患者進行fMRI掃描,與任何fMRI掃描一樣,它們揭示了大腦中電信号的閃爍以及這些區域如何互相關聯。

這種關系的術語是功能連接配接性,并且随着患者發展MCI而改變。這是因為信号依賴氧氣流向神經元,但是阿爾茨海默病患者中tau蛋白的積累會扼殺這些神經元,導緻腦部區域萎縮。

該小組想要看看他們是否可以使用功能連接配接的這些變化來預測阿爾茨海默病。他們從93名MCI患者和101名由阿爾茨海默病神經成像倡議提供的正常患者的資料開始。研究人員根據參與者大腦90個區域的130個fMRI測量結果的時間序列,可以确定信号在一段時間内閃爍的位置。

接下來,在一個關鍵的步驟中,這個小組處理這個資料集來建立這些信号在大腦區域相對于彼此的強度的二次度量。換句話說,他們建構了功能連接配接圖,顯示了哪些區域和信号彼此關系最密切。

最後,團隊建立了一個深度學習計劃,可以解釋這些模式的強度,并結合有關年齡,性别和遺傳風險因素的臨床資料,預測一個人是否會發展為阿爾茨海默病,準确率高達90%。

機器人進行外科手術的多種嘗試

如今,一些手術程式已經出現了智能機器的身影。機器人通常在一些程式中執行關鍵步驟,包括矯形膝關節置換,雷射眼科手術和頭發移植。這些手術的共同之處在于其目标的固定性質,因為在手術過程中可以固定腿骨,眼睛和頭部。軟組織手術更混亂,更難以自動化,因為身體的所有粉紅色部分都轉移并且很難追蹤。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

目前最先進的軟組織手術機器人是Intuitive Surgical的da Vinci系統,但它并不是自動化的。達·芬奇是一個遠端作業系統,外科醫生坐在控制台上,操作靈巧操作的控制裝置,通過患者體内的小工具進行模拟。

而上文所介紹的STAR,是通過整合一些不同的技術解決了軟組織的挑戰。其視覺系統依靠放置在腸組織中的近紅外熒光(NIRF)标簽;專門的NIRF相機跟蹤這些标記,而3D相機記錄整個手術區域的圖像。綜合所有這些資料,STAR能夠把重點放在目标上。機器人為縫合工作制定了自己的計劃,并在操作過程中随着組織的移動調整了計劃。

一位外科手術機器人領域的外部專家稱這項研究為一項突破,但也表示,其局限性是,自主機器人“不會很快進入手術室”。華盛頓大學自主外科手術機器人的先驅Blake Hannaford指出機器人所依賴的NIRF标簽是由人類放置的。

治療腦癌:時間與品質的權衡

在治療腦癌時,時間至關重要。

2017年8月,發表在《神經學遺傳學》(Neurology Genetics)雜志上的一項報告表明,在得到同樣的測序資訊後,IBM Watson用10分鐘提出了一個治療方案,而人家專家團隊使用了160個小時。但是,這一結果并不能簡單地看做是機器的勝利。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

該案例中的患者是一名76歲的男子,他去看醫生,抱怨頭痛,行走困難。腦部掃描顯示該男子腦部有惡性膠質母細胞瘤惡性良性腫瘤,外科醫生很快就該惡性良性腫瘤切除。該名男子也接受了三周的放射治療,開始了長期的化療。但是,盡管得到了最好的照顧,他還是在一年内死亡。

雖然IBM Watson和醫生都分析了病人的基因組,并且都提出了治療方案,但等到手術的組織樣本被測序之後,病人的身體已經衰退得太過厲害。

研究人員将IBM Watson進行的基因組分析結果,與NYGC的醫學專家團隊進行比較,後者由治療惡性良性腫瘤科醫師,神經惡性良性腫瘤專家和生物資訊學家組成。

IBM Watson和專家團隊都收到了病人的基因組資訊,并确定了顯示突變的基因,通過醫學文獻檢視這些突變是否已經在其他癌症病例中發現,尋找藥物治療成功的報告,并檢查這位患者有資格參加的臨床試驗。不過,人類專家團隊做完這些,花了160個小時,而Watson則在10分鐘之内做完。

但是,Watson的解決方案是最快提出的,但可能不是最好的。NYGC的臨床醫生确定了兩個基因突變,綜合考慮後,醫生建議患者參加一個針對兩種組合藥物治療的臨床試驗。而如果當時病人的身體條件允許,那麼他将被納入這個試驗。

但是,Watson沒有這樣綜合考慮這個資訊,是以沒有建議進行臨床試驗。

先天性白内障診斷,AI與人類醫生打平

中山大學眼科醫生Haotian Lin與西安電子科技大學Xiyang Liu的研究小組合作,開發了一種能診斷先天性白内障的AI程式CC-Cruiser,利用深度學習算法,預測疾病的嚴重程度,并提出治療決策建議。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

在計算機模拟中,CC-Cruiser能夠以98.87%的準确度區分患者和健康個體。評估疾病嚴重程度時,在三個關鍵名額(晶狀體混濁面積、密度和位置)上,準确度都超過了93%。不僅如此,系統提供的治療建議的準确率,也達到了97.56%。

在臨床試驗中,CC-Cruiser的表現也十分出色:98.25%的識别準确率,所有三個疾病嚴重名額評估準确率超過92%,治療建議準确率為92.86%。

但Lin強調,這種技術還“不足夠”,因為目标是以100%的準确性來确定最佳的治療過程。目前系統能做的,是幫助醫生,給出識别和治療建議,同時防止潛在的錯誤分類。

是以,CC-Cruiser并不會讓眼科醫生很快就失去工作。而且,人的交流和情感互動是醫療當中不可或缺的,而模拟人類的情感對于機器來說非常具有挑戰性。

醫患之間面對面的互動,将成為人類智能的最後堡壘之一。

皮膚癌診斷,AI算法與人類醫生表現幾乎相同

斯坦福大學的研究人員開發了一種深度學習算法,識别皮膚癌的準确率與專業的人類醫生相當,相關研究論文被選為封面論文,在2017年2月的一期 Nature發表。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

研究人員訓練系統觀看了近13萬張痣、皮疹和其他皮膚病變的圖像,覆寫了2000多種不同的疾病類型。他們使用這一資料集建立了圖像庫,并将其作為原始像素提供給算法,每個像素都帶有标簽,描述了相關疾病的附加資料。

為了測試算法的性能,研究人員找來斯坦福醫學院的21名皮膚科醫生。實驗中,算法和人類醫生需要完成三項任務:①角質細胞癌分類、②黑素瘤分類,以及③使用皮膚鏡檢查的結果對黑色素瘤進行分類。

在最後一項測試中,研究人員僅使用了高品質、經活檢證明的惡性黑色素瘤和惡性癌的圖檔。研究人員讓參與測試的人類醫生觀看這些圖檔,并詢問他們是“進行活檢、治療,還是安慰病人”。算法在發現所有癌性病變和不得到假陽性結果兩方面都表現良好,綜合準确率為91%,與人類醫生表現相當。

斯坦福大學的研究人員希望在不久的将來将他們的這項技術投入實用,讓更多人獲得更好的醫療服務。試想一台就在你智能手機裡的皮膚癌檢測儀,随時随地友善使用。

AI賦能顯微鏡能計算血液樣本中的瘧疾寄生蟲

近日,一家中國制造商和由比爾·蓋茨支援的風險投資公司将宣布計劃将顯微鏡商業化,該顯微鏡使用深度學習算法在20分鐘内自動識别和計數血液中的瘧疾寄生蟲。AI驅動的顯微鏡可以加速診斷,并實作标準化規模化檢測。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

AI賦能顯微鏡的實驗版本已經顯示,它可以很好地檢測瘧疾寄生蟲,以達到世界衛生組織最高顯微鏡标準,稱為能力等級1.該等級意味着它可以與訓練有素的顯微鏡專家,盡管研究人員指出,一些顯微鏡專家仍然可以勝過自動化系統。

正在開發的EasyScan GO顯微鏡将結合明場顯微鏡技術和運作深度學習軟體的筆記本電腦,該軟體可以自動識别導緻瘧疾的寄生蟲。人類實驗室的從業人員大多将注意力放在制備血液樣本的玻片上,在顯微鏡下觀察并驗證結果。

Intellectual Ventures在華盛頓貝爾維尤的首席研究員本·威爾遜(Ben Wilson)表示,瘧疾寄生蟲為深度學習算法提出了一個棘手的“罕見的對象問題”,通常需要大量的訓練資料來準确地識别對象。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

微小的瘧疾寄生蟲可能隻會出現在血塗片的數百個顯微鏡圖像中少數幾次,在感染水準非常低的情況下,10萬個紅細胞中可能隻有一個瘧疾寄生蟲。

該解決方案需要将深度學習和用于分割圖像中感興趣事物的傳統計算機算法相結合。它還需要大量基于制備的顯微鏡載玻片的教育訓練資料。

原型顯微鏡掃描每張幻燈片的速度大約與專家人類顯微鏡專家相當,每張幻燈片20分鐘。但威爾遜預計最終能夠将掃描時間縮短一半,每張幻燈片隻需10分鐘。

更重要的是,即使現有版本的顯微鏡可以補充有限數量的訓練有素的顯微鏡可用于确定瘧疾和追蹤多藥耐藥性瘧疾。 Motic公司的Nunnendorf說:“從本質上講,這是一個巨大的效率提升,而不是實驗室技術人員的機器人替代。

一般性診斷,醫生絕對優勢擊敗AI

根據Benton基金會2013年的研究,約三分之一的美國成年人已經通過通路線上網站來檢查他們的症狀。哈佛大學醫學院的醫生Ateev Mehrotra說:“APP和網站”是普通人士常用的診斷工具。

【AI全球大戰醫生】Hinton:5-10年内深度學習取代放射科醫生

BMJ(以前稱為“英國醫學雜志”)在2015年發表的研究中,Mehrotra和他的研究小組為23例症狀檢查者提供了45例标準患者的症狀,包括後來診斷為哮喘和瘧疾的患者。該小組發現,約三分之一的時間,檢查員列出了正确的診斷。

在新的實驗中,研究人員将檢查者的準确性與234名醫生、研究人員和居民的準确性進行了比較。對于每一個案例,至少有20名醫生提供了一個線上平台,列出排名前三名的診斷。

醫生們給出正确的診斷結果正确率在72%,而應用程式則為34%。

原文釋出時間為:2018-01-03

本文作者:張乾  弗朗西斯  文強

本文來自雲栖社群合作夥伴新智元,了解相關資訊可以關注“AI_era”微信公衆号

繼續閱讀