天天看點

BDTC 2017丨探索大資料在醫療行業的應用實踐

12月7-9日,由中國計算機學會主辦,CCF 大資料專家委員會承辦,中國科學院計算技術研究所、中科天玑資料科技股份有限公司、CSDN協辦的2017中國大資料技術大會(BDTC 2017),在北京新雲南皇冠假日酒店隆重舉行。本次大會以“大資料與智能”為主題,聚焦最純粹的技術幹貨分享,和最接地氣的深度行業案例實踐,彙聚國内外頂尖技術專家,共論最新的大資料技術實踐與發展趨勢。

BDTC 2017中國大資料技術大會進入第三天,與會者熱情不減。精準醫療大資料論壇在國家超級計算長沙中心副主任彭紹亮的主持下正式開始,将有來自上海交通大學生命學院生物資訊與生物統計、軍事醫學科學院微生物流行病研究所、中國科學院上海生命科學研究院、軍事科學醫學院、中國科學院微生物研究是以及智超醫療的學界和企業界專家帶來非常精彩的醫療大資料幹貨分享。

超級計算與精準新藥發現

BDTC 2017丨探索大資料在醫療行業的應用實踐

上海交通大學生命學院生物資訊與生物統計系以及微生物代謝國家重點實驗室長聘教授魏冬青

上海交通大學生命學院生物資訊與生物統計系以及微生物代謝國家重點實驗室長聘教授。Nature-Springer SCI期刊”Interdisciplinary Sciences – Computational Life Sciences”主編, “J. Mol. Graph and Modeling”, “Molecular Simulation”等10家雜志編委。發表SCI文章200多篇,主編專著9部,SCI引用 超過 5000次, H因子47。獲得橫山亮次(Yokoyama Ryōji)獎,上海交大科學技術獎和上海市優博導師稱号。衛生資訊學會大資料應用評估與保障專業委員會副主委、國際交叉科學學會會長。

作為首個分享講師,上海交通大學生命學院生物資訊與生物統計系以及微生物代謝國家重點實驗室長聘教授魏冬青,帶來了《超級計算與精準新藥發現》的主題演講。魏冬青表示,基因突變包括單核苷酸多态性(SNP)、核苷酸序列重複、插入以及缺失等,其可能會引起編碼蛋白的氨基酸序列改變,導緻蛋白結構變化而影響活性,也有一些位于調控區的基因突變可能引起功能蛋白表達量的差異。現已發現多種編碼藥物代謝酶、轉運蛋白以及作用靶點蛋白(如受體)的基因存在着基因多态性,其中藥物代謝酶基因多态性可能影響到藥物吸收、分布、代謝和排洩的藥動學過程,導緻患者出現嚴重毒性反應或治療無效。 我們開發了分子模拟與計算機輔助藥物設計軟體SAMM,建構細胞色素P450酶多态性基因型-表型相關性資料庫。把支援向量機,神經網絡,貝葉斯等非線性方法開發了統計預測模型以及基于web的軟體工具并應用到藥物構效關系,藥物代謝以及毒理和基因表型相關性的研究中。 開發了SNPs及ADMET 線上預測平台, 并将其應用到各種典型體系,對個性化藥物用藥有一定的指導意義。

精準醫療的網絡标志物

BDTC 2017丨探索大資料在醫療行業的應用實踐

中國科學院上海生命科學研究院系統 生物學重點實驗室執行主任、研究員陳洛南

中國科學院上海生命科學研究院系統 生物學重點實驗室執行主任、研究員陳洛南,發表了《精準醫療的網絡标志物》的主題演講。據陳洛南介紹,相當多的證據表明,在複雜疾病發展過程中,惡化發展并不是持續的而是突發的。在這裡,我們開發了一個無模型的方法來檢測這種關鍵轉變(或未發生疾病)的早期預警信号,即使隻有少量的樣本。具體而言,我們從理論上推導出基于動态網絡生物标志物(DNB)的指數,其作為一般性的預警信号,表明在臨界轉變發生之前即将突然惡化。基于理論分析表明,預測從小樣本突然轉變是可以實作的,前提是每個樣本都有大量的測量資料,例如高通量資料。我們使用三種疾病的基因表達資料來證明我們的方法的有效性。DNB與疾病的相關性也通過相關的實驗資料(例如肝癌,肺損傷,流感,2型糖尿病)和功能分析來驗證。DNB也可以用于分析非線性生物學過程,例如細胞分化過程。實際上可通過網絡來标志物來診斷疾病,網絡标志物是更穩定的形态,由此希望醫學上所有生物所用分子标志物都用網絡标志物代替,陳洛南認為網絡标志物對精準醫學更有幫忙。

利用微生物基因組測序大資料挖掘噬菌體暗物質資訊

BDTC 2017丨探索大資料在醫療行業的應用實踐

軍事醫學科學院微生物流行病研究所研究員、教授、博士生導師童贻剛

軍事醫學科學院微生物流行病研究所研究員、教授、博士生導師,複旦大學遺傳專業理學學士,軍事醫學科學院理學博士,加拿大UBC博士後。長期從事微生物基因組學、病原體高通量測序篩查、細菌耐藥基因傳播機制及噬菌體研究。在Nature,PNAS,柳葉刀傳染病等雜志發表了SCI論文120餘篇。作為中國第三批醫療隊首席科學家赴塞拉利昂參與埃博拉疫情防控。以第一作者身份在nature雜志發表埃博拉病毒進化研究論文被評為2015年度中國科學十大進展之一。

軍事醫學科學院微生物流行病研究所研究員、教授、博士生導師童贻剛,發表了《利用微生物基因組測序大資料挖掘噬菌體暗物質資訊》的主題演講。據童贻剛介紹,伴随着高通量測序技術的快速發展,産出海量的基因組測序資料,這些資料中蘊含的資訊可以從不同的角度反複挖掘。近年來微生物基因組測序資料也像其他測序資料一樣指數增長,大量測序原始資料中有價值的資訊等待再次挖掘,這其中就包含細菌的病毒——噬菌體的基因組資訊。随着細菌對抗生素耐藥問題的日益嚴重,噬菌體及噬菌體治療逐漸成為生物醫學研究的熱點課題。噬菌體作為細菌的病毒,廣泛存在于自然界的各種生境之中,其種類和數量遠遠大于細菌。噬菌體除了作為抗生素的補充和替代品之外,其豐富的基因資源可以廣泛用于各行各業,包括分子生物學研究、藥物遞送載體、表面呈現技術、三代測序技術、電化學、材料科學等等。噬菌體基因組序列包好噬菌體全部遺傳資訊,是了解噬菌體、研究和應用噬菌體的基礎。對噬菌體進行基因組測序涉及噬菌體的培養、富集、核酸提取、建庫上機、全基因組序列拼接、基因的注釋、溶原性的判别、基因組實體圖譜分析等等。本實驗室近年來進行了大量的噬菌體基因組高通量測序和生物資訊學研究,對上述的問題形成了一整套解決方法,積累了豐富的經驗,獨創一種非常實用的利用深度測序大資料确定噬菌體基因組末端特性的方法,發現了多種噬菌體基因組末端的特性;同時建立了預測功能性前噬菌體的方法,可以從細菌基因組測序原始資料及裂解性噬菌體基因組測序資料中發現隐藏的功能性前噬菌體的完整基因組序列。

基于深度學習的人類基因組智能解讀

BDTC 2017丨探索大資料在醫療行業的應用實踐

軍事科學醫學院研究員伯曉晨

伯曉晨研究員分别于1996年、1999年和2002年獲得國防科技大學自動控制、模式識别和控制科學專業學士、碩士、博士學位,2003年開始從事生物資訊學研究工作。現任軍事醫學科學院研究員、博士生導師、科技處處長。目前研究方向包括新一代測序技術、系統生物學等。作為負責人和主要研究者先後承擔“精準醫學研究”國家重點研發專項、國家重大新藥創制、863、自然基金重大研究計劃、自然基金重點、自然基金面上項目等18項。在Nature、Nature Microbiology、Nucleic Acids Research、Bioinformatics等期刊發表SCI論文50餘篇。先後獲得軍隊科技進步一等獎、國家科技進步二等獎、北京市科學技術獎一等獎等獎勵。2007年入選北京市“科技新星”,2012年入選總後科技新星。現兼任北京自動化學會理事、中國藥理學會網絡藥理學專業委員會常務委員等。

軍事科學醫學院研究員伯曉晨,發表了《基于深度學習的人類基因組智能解讀》的主題演講,其内容主要分為四個部分:後基因組時代的挑戰;DNA複制時間域的識别;增強子的識别;RNA編輯位點的識别。伯曉晨表示,人類基因組計劃的完成開啟了後基因組時代,而後基因組時代的一個重要任務是對基因組的解讀,特别是對占人類基因組97%的非編碼區的解讀。ENCODE等後基因組大資料計劃的實施為我們提供了大量用于解讀人類基因組奧秘的多組學資料,但同時也對海量多組學資料人工分析提出了挑戰。在此背景下,我們嘗試采用多種機器學習方法來實作人類基因組的自動注釋。針對DNA複制時間域的識别、增強子的識别和RNA編輯位點的識别三這個重要的基因組注釋問題,我們基于已經實驗驗證的結果建立了多個機器學習模型,實作了高精度的基因組解讀。根據機器解讀的結果,我們進行了全基因組的預測,并通過對預測結果的分析揭示了許多有趣的生物學現象。我們的結果表明,基因組資訊學正在進入智能時代,未來我們完全可以依靠人工智能來解讀人類基因組這部“天書”。

病原基因組學與進化

BDTC 2017丨探索大資料在醫療行業的應用實踐

中國科學院微生物研究所研究員、中國科學院武漢病毒研究所研究員、中國科學院大學存濟醫學院教授劉翟

2000年于北京大學生命科學院獲理學學士,2005年畢業于北京大學生物資訊中心獲生物資訊學博士學位。是教育部授予的首批生物資訊學博士。2005年進入中國科學院微生物研究所,曆經博士後、助理研究員、副研究員,于2014年被破格提升為研究員。2016年被聘為中國科學院大學醫學院教授。任中國微生物學會生物安全專業委員會副主任委員,中國遺傳學會青年委員會委員,國際應急管理協會亞太衛生應急專業委員會常務委員,軍委科技委國防科技創新特區主題專家。“生物安全關鍵技術領域”國家重點研發計劃項目負責人。主要研究方向:病原基因組學與進化,生物資訊學等。以通訊作者或第一作者在Lancet,Nature, Nature Microbiology, Nature Communications, Cell Host & Microbe等雜志發表研究論文20餘篇,累計影響因子超過200,單篇論文最高他引213次。共發表研究論文80餘篇,總引用次數超過3400次,H-index:26。

中國科學院微生物研究所研究員、中國科學院武漢病毒研究所研究員、中國科學院大學存濟醫學院教授劉翟,發表了《病原基因組學與進化》的主題演講。傳染病一直以來都是人類健康的重要威脅,據WHO統計每年全球有約1500萬人因傳染病喪生。病毒作為重要的傳染病病原,由于其變異速率快、遺傳與傳播模式獨特,經常會造成較大規模的暴發與流行。近年來,國際上相繼出現了(禽)流感病毒、埃博拉病毒、中東呼吸綜合征冠狀病毒、寨卡病毒暴發等事件,嚴重影響公共衛生和全球經濟的發展。明晰傳染病病原的進化與傳播規律是制定科學有效的傳染病防控政策的必要前提,具有重要的科學價值和現實意義。相較于傳統的病原學研究方法,基因組學和生物資訊學能夠更加快速的對于病毒的進化規律進行解析,成為病原研究的重要熱點之一。此次分享主要圍繞病毒進化與傳播規律,利用病毒基因組學和生物資訊學作為主要手段,面向禽流感病毒起源、進化模型、遺傳變異和傳播動力學等科學問題展開。主要揭示人感染H7N9禽流感病毒的起源、進化與傳播規律;指明我國人感染禽流感頻發的根源;解析了我國H5N6禽流感病毒的進化規律。通過研究以H7N9和H5N6為代表的禽流感病毒在我國的進化規律,指出了活禽市場與活禽交易是我國禽流感大面積流行的最主要原因,為傳染病的精準防控提供了重要依據。

醫療健康大資料驅動下的人工智能醫生

BDTC 2017丨探索大資料在醫療行業的應用實踐

天河”生命科學方向負責人、國家超級計算長沙中心副主任、華大基因研究院“特聘教授”、湖南大學嶽麓學者特聘教授彭紹亮

彭紹亮,教授,博導,在國防科技大學計算機學院從事高性能計算、大資料、生物資訊、移動計算等技術研究工作,并擔任“天河”生命科學方向負責人,國家超級計算長沙中心副主任,華大基因研究院“特聘教授”,湖南大學嶽麓學者特聘教授。已發表學術論文數十篇,其中包括Science, Nature Communications, Cell AJHG, Genome Biology, NAR, Cancer Research, ACM/IEEE Transactions, BIBM,《中國科學》等。曾參與天河系列超級計算機應用軟體研發工作,參與國家973項目、863項目、軍隊重大型号項目等13項,獲軍隊科技進步一等獎1項,2016年榮立三等功。是中央軍委科技委生物交叉立項專家組成員、國家科技專家庫專家、中國計算機學會理事(2016-2019),CCF計算機應用專委會副主任和生物資訊專業組副主任,YOCSEF長沙主席(2016-2017)和總部AC委員(2017-),CCF高性能計算、大資料專委委員、CCF進階會員和傑出講者、擔任多個國際期刊主編和副主編。

天河”生命科學方向負責人、國家超級計算長沙中心副主任、華大基因研究院“特聘教授”、湖南大學嶽麓學者特聘教授彭紹亮,發表了《醫療健康大資料驅動下的人工智能醫生》的主題演講。近年來國家大力推行分級診療制度,移動醫療,遠端醫療方興未艾。同時存在,三甲醫院就診人數密集,分導診能有效提高醫院運作效率;現有的分導診簡單粗暴、準确度差,病人滿意程度低等問題。而建立臨床醫療診斷輔助決策平台的主要目的之一就是提高醫療的安全性和診療品質,減少醫療差錯,增加病人的就診體驗。目前基于天河超級計算機研發了有三個技術,智能化無人值守體征采集一體機(目前覆寫16大項,128個小項)、基于大資料的分導診人工智能機器人、臨床醫療診斷輔助決策平台。三種技術都是基于天河超級計算機和國家超級計算長沙中心進行大資料管理分析和人工智能模型計算的。目前系統已經在國内多家三甲醫院部署和使用,挂号準确率提升到99%,降低患者挂号時間約25%,降低分導診中心工作量40%。誤診率下降20%以上,處方有效率提升30%以上,看病時間減少80%以上。

更多精彩内容,請關注直播專題2017中國大資料技術大會(BDTC),新浪微網誌@CSDN,觀看大會圖文直播,請掃描二維碼關注CSDN資訊微信公衆号。

BDTC 2017丨探索大資料在醫療行業的應用實踐
BDTC 2017丨探索大資料在醫療行業的應用實踐

繼續閱讀