天天看點

IBM Dr Watson 的那些事兒

任何依賴經驗傳承的行業,都需要足夠的記憶力。就記憶力而言,長遠來看,人腦一定比不過電腦。是以,從人類研究電腦伊始,尤其是開始研究人工智能以來,世界頂級研究機構,就緻力于電腦醫生的研制。

早期比較出名的研究項目,是斯坦福大學的 MYCIN (1),這套系統把醫學臨床指南,整理成 if-then 那樣的規則,企圖以此診斷疾病并下處方。if-then 式的規則庫,又稱為專家系統。MYCIN 共整理了 600 多條 if-then 式的規則。可惜,MYCIN 從未走出實驗室投入臨床應用。

在 MYCIN 的基礎上,其它研究機構,添加了反繹推理等等,進一步完善推理機制,後來又添加了模糊數學,機率,貝葉斯模型等等,均不成功(2)。

就這樣,從 1970 年到 2010 年,基于 if-then 式的演繹法及其變種,電腦醫生的研究持續了 40 年,屢戰屢敗。人們開始反思,是不是應該換一個思路?2011年8月 IBM Dr Watson 登場了。

IBM Dr Watson 起初是一個研究項目,研究自動問答系統。例如,問:“誰是第一個登上印度次大陸的歐洲航海家?”。問答系統自動閱讀大量文獻,摘錄出 “葡萄牙人,瓦斯科·達·伽馬,于1498年5月20日到達卡利卡特”。又從其它文獻中,摘錄出 “卡利卡特位于印度西南部”。串聯這兩條資訊,得出 “葡萄牙人,瓦斯科·達·伽馬,于1498年5月20日,登陸印度” 。同理,找到其他歐洲航海家登陸印度的時間。最後排序,進而找到問題的答案。

IBM 研究院從 2006 年開始研究自動問答系統,并參與美國智力競答電視節目,Jeopardy!這個節目與江蘇衛視的 “一站到底” 類似,主持人出題,競答者比賽準确性和搶答速度。5 年以後,2011 年 2 月,IBM 的自動問答系統,戰勝了往屆人類冠軍,一舉奪魁。

半年後,2011 年 8 月,IBM 決定把自動問答系統,應用到醫療領域。

IBM Dr Watson 的那些事兒

以上是 IBM 自動問答系統的工作流程(3)。整個系統圍繞三個核心構成,1. 自然語言處理,2. 基于循證的自動回答,3. 基于使用者回報的自學習和系統優化。其中,自然語言處理,和基于使用者回報的自學習和系統優化,大體上是常見技術。

這三個核心中,最有啟發的是第二個,基于循證的自動回答。以往的電腦醫生,基本原理都是專家系統,都是基于 if-then 式的規則,都是演繹法。而循證問答,基本原理是類比歸納法。通過類比大量相似病曆,歸納出對應于某些症狀,醫生們通常習慣于做哪些檢查。然後,類比相似檢查結果,歸納出這些檢查結果與哪些疾病關聯密切。再然後,仍然基于相似病曆的類比,歸納出對應于某一疾病或者某些疾病的組合,醫生們通常習慣于開哪些藥,等等。

從古希臘的帕拉圖亞裡士多德開始,人類的主要思想方法,是演繹法。到 17 世紀初,呐喊 “知識就是力量” 的培根,首倡歸納法。思想方法轉變了,現代科學就萌芽了,随後就有了伽利略、牛頓、萊布尼茲等等科學巨匠。

循證學習依賴于海量病曆。但是截止 2013 年 2 月,IBM Dr Watson 隻收集到了 60 萬份病曆,此外還有 2 百萬篇文章,2.5 萬案例,1.5 萬小時的門診對話錄音(4)。遠遠達不到海量的資料規模。

怎麼辦?病曆數量太少,做全科醫生肯定不行。那就專門收集惡性良性腫瘤專科的病曆吧,全科醫生做不了,那就先做專科醫生吧。

為什麼不惜工本的 IBM,花了那麼多錢,隻收集了那麼一點病曆呢?兩個原因,1. 美國人口基數小,2. 美國隐私保護法執行太嚴。反觀中國,一家中等規模的三甲醫院,5 年積累的病曆數量,就超過 1000 萬份。是以,在中國做循證學習,比在美國更有機會。

今年 7 月份,IBM 與美國最大的連鎖藥店 CVS,簽署合作協定,通過 CVS 的 7600 店鋪和 1000 家診所,監測 7 千萬患者的健康狀态,尤其關注糖尿病、高血壓等慢性病(5)。今年 8 月份,IBM 花費 10 億美金,收購醫療圖像分析公司 Merge Healthcare(6)。

這兩個舉措,似乎表明 IBM Dr Watson 在發展規劃上,内部有争議。與 CVS 合作,似乎意味着 IBM 計劃盡快開拓市場,為患者服務。而收購圖像分析公司 Merge Healthcare,似乎意味着 IBM 打算深入惡性良性腫瘤、眼科、骨科、皮膚病等專科,最終完全取代人類醫生診療在診療過程中的各個環節。

作為旁觀者,更贊同與 CVS 合作,盡快開拓市場。而全面取代人類醫生,即便僅限于某幾個專科,将面臨諸多艱難。但是與 CVS 合作,最好是全科,而不僅僅局限于專科。

沙特是全球石油儲藏量最大的國家,中國是全球電子病曆儲藏量最大的國家。

如果中國也做 Dr Watson,很有希望超越 IBM 的版本。

作者微信:deng_kan

參考文獻

(1)Introduction to MYCIN.

​​https://en.wikipedia.org/wiki/Mycin​​

(2)Introduction to Clinical Decision Support System.

​​https://en.wikipedia.org/wiki/Clinical_decision_support_system​​

(3)Introduction to IBM Dr Watson。

​​https://en.wikipedia.org/wiki/Watson_(computer)​​

(4)IBM Watson Progress and Roadmap,2013.

​​http://www.slideshare.net/manojsaxena2/ibm-watson-progress-and-roadmap-saxena​​

(5)IBM Watson and CVS deal.

​​https://www.washingtonpost.com/news/to-your-health/wp/2015/07/30/ibm-watson-cvs-deal-how-the-smartest-computer-on-earth-could-shake-up-health-care-for-70m-pharmacy-customers/​​

(6) IBM vs Merge HealthCare.