天天看點

大資料助力智慧醫療健康新啟程

<b>摘要:</b>本文整理自雲栖techday 23期活動中阿裡雲大資料進階專家張鴻飛(彧然)的分享。醫學是一個實踐科學,很多知識都是通過實踐經驗積累的,而經驗最根本就是資料,是以,資料對整個醫療的發展有非常好的促進作用,在本文中彧然分享了醫療大資料如何借助雲計算能力實作人工智能的落地,産生資料的智能,以及針對網際網路醫療面對的挑戰該如何應對。<b></b>

<b></b>

<b>以下内容整理自現場速記以及演講ppt</b>

今天,阿裡雲的思路就是打造這樣的一個生态體系:從底層把阿裡雲的平台和裝置變成像水電一樣的普惠科技,進而把技術和能力輸出出來。由于阿裡雲擅長對資料處理能力,這時候就需要與領域内的客戶進行充分的合作。比如像在醫療行業,阿裡雲的客戶往往擁有更多在醫療行業的服務的專家,讓他們去與醫療行業結合,阿裡雲則是把底層的雲的平台和技術輸出給大家。大資料談了那麼多年,其實可以把它往大了想,也可以把它往小了想,一個簡單功能的實作其實也是大資料的應用。是以根本上講,還是需要把大資料落地,所有的東西都要結合業務,技術和平台的輸出要結合到業務點上去把它落地,這樣才能形成一個有幫助的,能解決問題的成果。無論是節約經濟成本還是時間成本,還是提高效率,或者是進行創新,隻要能解決問題,就是大資料的一個成功落地。但是如果沒有找到一個落地實作,那大資料本身就是空想。

阿裡雲在各個行業裡面基本都形成了一些落地的方案,這些方案和經驗的積累能使得阿裡雲對醫療行業有所推動。但是今天的醫療行業是大資料推進相對比較遲緩的部分,因為這裡面有太多的政策因素,以及行業的特殊性。醫療行業特殊性造成資料紛繁複雜,比其他傳統行業裡面結構要廣得多,也要複雜得多,在醫療行業資料有圖檔的,有圖像視訊的,有語音的,甚至醫生寫的潦草的病例單子,各種資料都有。而且在醫療行業裡面,要落地大資料也有很多政策從國家層面指導我們。

大資料助力智慧醫療健康新啟程

2030健康中國的報告是國家處于政策層面做出的政策引導。傳統方式是把醫療和健康隔離開來,生病了才去醫院看,不生病時大家對于保養健康也關注的比較少。2030健康中國報告提供了一個思路就是把醫療和健康結合起來,今天很多網際網路創業公司也在更多地關注健康,給大家提供更多的服務,比如美柚這些app,以及一些網上健康監控和可穿戴裝置,它們對我們的健康幫助很大。

從國家層面來講希望将健康和醫療整合在一起,我也發現一點就是比如優化多元格局醫療發展健康服務的新形态,其實就是把醫療健康和傳統結合起來。比如病人去醫院看完病,也能線上跟蹤自己的健康狀況和報告,包括病好了之後,了解怎麼保持健康狀态。是以共享全面健康需要引進網際網路思維。所謂網際網路思維其實很簡單,網際網路三大基因就是連接配接、分享和智能。在傳統醫療行業裡面有三大痛點:資源不均衡并且使用率低,資訊孤島嚴重,經驗醫學資源浪費嚴重。

大資料助力智慧醫療健康新啟程

資源不均衡并且使用率低的表現就比如有些醫院在地理位置,或者國家财政方面的投入,以及裝置資源投入相對比較多,但是這些資源未必會得到100%的利用。

另外情況就是資訊誤導嚴重,醫患交流不通暢。大家去醫院看病,實際上隻是挂這個科,病人跟醫生有一個直接的交流,但基本不存在橫向的交流, 這些資訊其實都沒有共享,或者說不知道以往人家是怎麼解決的。隻能說醫生告訴病人他的經驗,因為醫生會知道其他人進來是什麼狀況,是什麼樣的診斷方案,出現了什麼結果。但是作為患者來講是不知道的,他不知道其他人出現這個情況後面是怎麼做的,需要注意什麼,治療方案是什麼,後面出現很多結果,最後什麼是好的,都不知道。是以醫院裡面不光是醫患的資訊不通暢,而且醫院橫向的資訊也是不通暢的。比如說科室跟科室之間,醫院跟醫院之間資訊往往不通暢。

還有資源的浪費問題,剛才提到醫療裝置的問題,一些裝置不能100%的利用。舉個例子說明什麼是資源共享。今天在很多行業裡面都會涉及到行業裡一些共性的地方,比如說病人在醫院做了影像,這個影像在各個醫院拍出來都是大同小異的,但是每個醫院都重新做一次。為什麼不做一個專門抽血和拍照的醫療檢測中心呢,拿到結果在各個醫院都可以看,把這些有共性的東西抽出來就達到了資源整合,并且提高了效率。比方拍影像非常慢,可能要兩三天才能拿到,有些醫院就比較小,影像有時候可能都沒有人用,也浪費了資源。将這些共性的東西抽離出來作為一個中心以後,病人需要挂專家号,隻要把前期的報告拿給專家就好。是以講網際網路思維怎麼去引導行業,不光需要依靠大資料,而是首先應該從思維上去轉變。引入網際網路健康和醫療,那剛剛提到的是幾個可能方向,比如說資源共享。

大資料助力智慧醫療健康新啟程

醫療行業面對的技術挑戰,包括如何保證系統的安全穩定,保護醫療資訊不洩露,因為這些資訊都關乎生命。從另外一個角度講,安全這個問題,需要重點關注一下,在很多這些關鍵制造領域,往往都是不安全的。其實從今天的技術角度來講,安全已經不應該是大家關注的核心點了。因為技術已經能夠保障了,更多安全問題實際上是在于人,為什麼這麼說呢?舉一個例子,美國的中情局,大家覺得它夠安全了吧,但是為什麼還是有資訊露出來呢,因為斯諾登,是以也印證了那句話,堡壘是最容易從内部攻破的。是以所謂的安全體制從技術上講沒有太多的缺陷,更多在于人的因素。而人的因素怎麼去把控呢?首先要做到權限審級,資料安全的權限審級,所有的資料安全分等級非常嚴格,可見阿裡雲對安全的重視。

回到一個很通俗的話題講安全,什麼是絕對的安全。比如說飛機安不安全?飛機安全還是汽車安全?飛機看上雲不安全,是因為它受到的關注度更高,就像阿裡雲今天在國内說雲計算是一樣的,受到了萬衆矚目,是以一旦上面出一丁點的問題,大家就說不行,這個有漏洞。飛機不安全是因為隻要出現一個很小的事故都會報道,大家都會知道。但是相對來講,飛機乘客生命安全對航空公司來講就是生命線,就好比說今天阿裡雲客戶在上面資料是阿裡雲營運的生命線是一樣的。今天開放雲平台給更多的企業,就是阿裡雲的生命線。實際上與飛機相比,汽車更不安全。是以所謂資料安全在我看來隻要大資料或者資料人工智能能夠解決問題,提高效率,安全相對來講就沒有問題。今天在阿裡雲上的資料往往就能夠解決你的問題,就好比開車可能要開好幾個小時,飛機一會兒就到了。是以資料安全不是絕對的,但是今天阿裡雲花了很大的代價,把資料安全當成生命線去維護。而在醫療行業,往往很多醫院不希望把資料遷移到雲上,當然我也了解他們在安全方面的顧慮,這也是無可厚非的,但是我覺得更重要的是今天的大資料和人工智能能不能幫助他們解決問題。

第二個挑戰就是業務的增長,醫院這些資源實際上今天還是有由政策去配置設定,就像是計劃經濟一樣,各個醫院的資源是有統一規劃的,但這個規劃未必适合目前市場。比如說某段時間爆發了某種疾病,就需要某種特别的藥,但是醫院其他科室可能用不着,可以在科室之間調撥。但是當規模成長起來後,資源往往沒有辦法滿足情況下,隻能幹等着,沒有一個彈性伸縮的能力。而網際網路裡面一些核心資源就是彈性伸縮的,可大可小可變,它是共享的。

而對于營運效率的提高,再給大家舉個例子,比如說大家到醫院裡面去看病,看的時候隻是知道腳疼,但是不知道挂什麼科,可能就先挂一個骨科,骨科大夫說好像不是骨頭的問題,查完他說你去挂個内科吧,然後内科一看是不是尿酸過多造成關節疼。這個還是簡單的,有可能還會跑兩三趟。是以這裡面存在很多營運效率的問題,制度上來講還有很多提升的空間的。大資料和人工智能怎麼幫助醫療行業去完善這些,怎麼去提升效率呢? 從概念上來講,人工智能實際上是大資料領域裡面的,其實對資料分析也好,智能化角度也好,人工智能更傾向于通過資料層面去學習人的思維。

大資料助力智慧醫療健康新啟程

舉個例子說,醫院中有各種各樣的資料,其中有很多文本資料。而人工智能可以解決很多相關問題,比如說在文本上面舉一個例子,很多醫生把病人的診療資訊或者病例表述都寫成一句話,但真正要對這些資料進行處理的時候,要從這些話裡面提取去關鍵資訊,比如說腦卒中的例子,腦卒中死亡率是相對高的,複發率也是比較高,就醫時間的效果差别很大。

大資料助力智慧醫療健康新啟程

在分析這個病例的時候,拿到醫院資料一看全都沒用的資訊。怎麼去分析這個資料呢?首先把文本中的東西提取出來,再結合與醫生溝通,抽象出了就醫時間和前期症狀以及後遺症這三個次元,這三個次元的資料就需要從電子病例裡面提取出來,提取的過程就需要阿裡雲輸出的能力。提取文本資訊的過程,比如把非文本結構化的資料進行輸入,因為前期症狀很重要,做需要一個形象的比對,看到部分症狀然後再進行學習,模式比對再循環的一個過程,最後得到分析的模型。隻需要從這三個次元去提取文本,然後再把這些文本做一個結構化梳理就可以,當然在這裡說的比較簡單,實際操作上還是比較複雜的。

從技術和架構上來講,就是建構一個基礎平台,在其上做一些業務應用,這個業務就是關鍵的技術處理了。比如用自然語意處理做分詞,如何提取關鍵詞,就像發熱頭疼是一個關鍵詞,前面會不會有否定詞,是以需要做一些聚類。是以首先會把語意部分了解出來,提取出相應的詞,這部分詞是歸納作為語意的,另外一部分是做機器學習。機器學習就是說在這個過程中反複進行訓練,看上下文能不能表達準确的意思。再往上就是分析的業務,最後形成一個具體的業務應用,比如說病例的結構化分析,病症的分析。人工智能和大資料都是對任何行業都是一個輔助的作用,為什麼這麼講,輔助其實是很關鍵的,比如今天客服的智能語音系統可以代替人工90%以上的工作量,就像今天支付寶的客服一樣的。大部分是通過機器人是去做的,隻有少量的部分是需要人去處理。是以講任何人工智能都起到是輔助的作用。下圖就是當時做文本分析最後得到一個成果。

大資料助力智慧醫療健康新啟程

第二個方面是在影像裡面的應用,以前影像是專家來看的,他們通過經驗去看結節是不是異常的。但是怎麼樣讓普通的醫生也具備這些能力呢?就通過機器去幫助他們。實際上機器開始是不會識别結節的。通過學習病人的ct片,形成專家模型來判斷哪部分是結節。當然它也會分析圖檔裡面帶了症狀,這個黑點或者白點,是不是代表結節。這個其實是很難去判定的,當然機器會經過大量的圖檔學習專門去做,并且去反複驗證這個過程,讓機器越來越精确,也會通過專家修正模型,在這個過程當中機器會越來越智能。通過系統學習就可以提升圖像識别的效率。

大資料助力智慧醫療健康新啟程

還有一個就是視訊處理,比方說住院看護大多數是通過體感特征監測器去判斷這個病人是不是有病況。通過視訊監控技術去判定病人這個階段的表現,從外體特診或者是本體特征對病人在視訊裡面的表現進行監控或是預測。 無論是在影像也好,視訊也好,都會通過這種方式能夠落地到醫療行業的場景,對整個行業效率進行提升。

影像分析識别搜尋,就是這麼一個大體的過程,比如病人曾經在這裡面就診過,病人再來的時候,系統通過人臉掃描一下就知道病人前期就診的資料,産生一個綜合的評定。同時會線上上做一些這樣的架構,比如說線上搜尋,可以直接搜尋出這個病症跟其他病人症狀是不是一樣的,其他人是采用什麼樣的方案去救治的,這些都是通過離線模式或線上模式進行比對的。離線模式的主要作用就是通過這些海量的資料不停的去訓練,判斷出每個病人是怎麼樣去做的,而線上模式檢測就是進行相似度比對。

大資料助力智慧醫療健康新啟程

在這個行業裡面,建構通用的知識庫未必是把資料拿出來研究這個病是怎麼發展的,但是可能是關于大資料如何落地,怎麼落地的。像剛才說的挂号可能會挂錯,一開始你知道腳疼但是不知道挂什麼科,這個過程就會很煩瑣。而且每次就診的資訊是獨立的,隻有你自己知道,或者醫生知道,但是互相之間是不知道的。而網際網路核心就是共享。會把很多過程抽象化,比如說問診、診斷、檢驗、治療進行抽象化。智能問診的過程,隻要有這麼一個知識庫,病人去就告訴它腳疼,然後再進一步描述一下,知識庫就建議去挂哪個科。知識庫就是根據以往專家的建議提供就診路線。這個知識庫就是回答,某個症狀應該去看什麼科,光是這個智能分診,就會使醫院的效率提高不少。更進一步,在某些就診方案裡面,醫生或專家是怎麼做的,就像影像識别一樣,專家是怎麼識别的,如何判斷結節,就可以建立一個知識庫,就是人工智能。

大資料助力智慧醫療健康新啟程

知識庫,比如像剛才講的問答機器人,專家系統智能分診,這些都是通過文本技術以及專家經驗建構出來的。再舉一個例子,比如說病人在找醫生看病時,醫生與病人之間的對話其實是沒有記錄的,記在電子病曆中的東西一定是病人的症狀和醫囑,實際上這個資訊是不全面的。其實可以通過語音或者是視訊把醫生跟病人交流對話全程記錄下來,轉化成文本。比如說後面的病人隻需要描述一下症狀,系統就會提示,某某醫生曾經給某個病人看過,給病人一個方案并且提示應該看什麼科,而且這個準确率是越來越高。整個醫療行業裡面,做智能分診,健康咨詢,健康咨詢是一個道理。醫療共享就是說會分享就醫經驗,把醫療健康資訊整合起來以後,通過就診資訊以及健康維護這些知識庫形成一個問答系統讓更多的人受益。

大資料助力智慧醫療健康新啟程

把醫院裡面專家的建議或者是醫生救治的辦法統籌起來形成一個知識庫。

大資料助力智慧醫療健康新啟程

醫療裝置也好,人的行為模式也好,都可以通過大資料方法去做的。在醫療行業裡面能做的事情很多,其實剛才講的這些無論是科研性質還是非科研性質,都是一些應用場景,這就是講大資料如何落地人工智能。除此之外,比如說醫院裝置的監控,監控裝置是不是要換,這些跟傳統的制造行業差不多了,現在他們也有裝置監控預警。

今天沒有講到具體的技術,而是更多的是通過從業務場景的角度去跟大家分享智慧醫療是怎麼落地的。哪怕是今天隻是在醫療行業做一個智能分層也好,語音識别也好,做一個視訊監控和行為模式識别也好,病人的畫像分析也好,這都是巨大的進步,都是将大資料落到實地,可能已經不知不覺地在大資料上産生了價值。我更多的是希望在阿裡雲通過這些頂層的技術輸出與這些行業進行結合,産生效果。當然更多的是需要這些行業裡面的專家,來跟阿裡雲結合,隻有技術跟具體場景結合起來,才能産生有成效的結果,這也是也是我們今天唯一能夠做的,也是未來的一個方向。

繼續閱讀