天天看點

醫療領域應用大資料技術的難題:收集資訊

醫療領域應用大資料技術的難題:收集資訊

科技部落格網站recode.net今天發表文章稱,許多機構的研究人員正在探索如何利用人工智能和大資料,為癌症等疑難病症找到更好治療方法,目前已取得進展,但他們在收集患者資訊上遇到難題。

文章主要内容如下:

ibm、波士頓制藥公司 berg pharma、紀念斯隆-凱特琳癌症中心(memorial sloan kettering)、加州大學伯克利分校(uc berkeley)及其它機構的研究人員,正在探索如何利用人工智能和大資料,找到更好的疾病治療方法。

但是,在醫療領域充分利用這些計算工具面臨的最大挑戰是,這方面的海量資料被束之高閣——或者說從一開始就沒有數字化。

早期的醫學研究成果或病人的病曆,往往鎖在醫藥公司的檔案或醫生辦公室的檔案櫃中。病人的隐私問題、公司間的利益沖突以及純粹缺乏電子病曆,阻礙着醫療領域的資訊共享,讓每一次治療都像一個孤立的事件。如果醫療領域的資訊共享能取得進展,人們很有可能發現更具普遍意義的治療方案。

加州大學舊金山分校的講師邁克爾·凱澤(michael keiser)指出,當你能夠對10萬個病人的臨床試驗資料、基因組資料和電子病曆進行分析時,與以往隻能接觸少數病人的資訊相比,你将能發現以往所不能發現的治療方案。

鑒于這樣的前景,一些組織開始着手将醫療資料整合在一起。去年年底,美國臨床惡性良性腫瘤學會(american society of clinical oncology,asco)宣布了旗下“cancerlinq”項目的初步進展情況。“cancerlinq”是一個“快速學習系統”,允許研究人員進入、通路和分析匿名癌症患者的病曆。

今年4月,一個有衆多主要制藥公司參與的非營利性組織——“癌症生命科學協會ceo圓桌會(the ceo roundtable on cancer)”,宣布推出pds計劃(project data sphere)。該計劃将打造一個第三階段癌症臨床試驗資料共享和分析平台,初始資料集已由阿斯利康、拜耳、新基醫藥(celgene)、紀念斯隆-凱特琳癌症中心、輝瑞、賽諾菲等共同提供。

這些資料已去除患者的個人資訊,并進行了統一編号,供生命科學公司、醫院、醫療機構以及獨立研究者可以免費使用。他們可以通路平台内置的分析工具,或者将資料插入到自己的軟體中。癌症ceo圓桌會議首席執行官馬丁·墨菲(martin murphy)表示,pds計劃可能有助于發現鮮為人知的癌症候選藥物,這些藥物可能對某些癌變有一定的療效。而在某一特定研究中,這些藥物可能會因為沒有達到研究的主要目标而被抛棄。

其它推進醫療領域資訊共享的努力還包括:由從多醫療機構、研究型大學、生命科學公司等組建的全球基因組學與健康聯盟(global alliance for genomics and health)、歐洲生物資訊研究所(embl-ebi)維護的分子生物資料庫,以及美國國立衛生研究院(national institute of health, nih)成立的“生物标記共同體(biomarker consortium)”等。

與此同時,用大資料服務惡性良性腫瘤醫療行業的初創公司flatiron health上月完成了1.3億美元 b 輪融資,由谷歌旗下風投機構谷歌風投(google ventures)領投。flatiron health 打造了一個“惡性良性腫瘤學雲平台(oncologycloud)”,能提取和整合病人電子病曆(emr)中的臨床資料以及醫療費用資料。

該系統使在醫生辦公室和醫院以不可持續和非結構化格式留存的資料變得有意義,進而能夠對大規模癌症患者群體的治療情況進行分析。理想情況下,它可以發現哪種治療方法對哪些類型的癌症患者有效。

flatiron health 聯合創始人奈特·特納(nat turner)表示:“flatiron health專注于所謂‘真實世界’患者的臨床資料。在美國,隻有4%的癌症患者會參與前瞻性臨床試驗,是以我們正在努力提取和整合剩下96%患者的資料。”

他說:“要真正了解什麼對癌症有效,其他患者正在接受什麼樣的治療,以及癌症領域的研究取得了什麼樣的成果,相關機構應該開放“去識别(de-identified)”的醫療資料和匿名的典型病例,這是flatiron health願景的一部分。”

隐私風險

可以肯定的是,推進醫療資訊的開放應該非常謹慎。醫療資訊是高度敏感的,是以任何隐私風險需求應慎重考慮。

醫療資訊能開放到什麼程度,取決于全社會所做出的讓步。許多人堅定地持有這樣的觀點:挽救生命最重要。但受舊習慣和過時規章制度的影響,社會的轉變速度還不夠快,這一點加州大學伯克利分校的計算機科學教授大衛·帕特森(david patterson)深有感觸。帕特森緻力于用于癌症研究的機器學習工具。

他說:“對于計算機領域的研究人員,我們習慣于網際網路時間和摩爾定律。但現在我們無法讓官方達成一緻,讓我們能夠大量快餐收集資料并進行整合,這是非常令人沮喪的。”

他指出:“患者的隐私很重要,但争取癌症治療領域取得進展同樣很重要。将大量治療資訊彙集在一起的好處是,我們可以在攻克這種可怕疾病方面取得進展。”

這些接受采訪的專家,還沒有誰能例舉出目前為止大資料等計算技術對癌症治療帶來了什麼突破。畢竟,這些技術都是新的,而且醫療資料集剛剛整合在一起,臨床試驗又需要數年時間。

但幾乎所有人都同意,在癌症治療方面,研究人員正處于重大突破的邊緣。

墨菲稱,如果把攻克癌症比喻為一座高山,目前已接近頂峰的邊緣,這一高度是前所未有的。

原文釋出時間為:2014-06-09

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀