新型冠狀病毒的爆發,猛然将全國醫療機構拽進了一場與病毒賽跑的戰役當中。
病毒傳播速度駭人,用藥需求迫切。各醫藥研究機構都想方設法利用最先進的技術,最大化縮短研發周期,加速有效藥物投入使用。
以計算驅動創新的藥物研發科技企業晶泰科技也于1月20日迅速成立研究小組,調集雲端算力,對病毒感染主控端理提供分子層面的研究,建立病毒關鍵蛋白與人體配體結合區域的三維模型,預測病毒可能出現的強傳染力突變,還從已上市藥物中篩選可能具有抗新冠病毒活性的藥物,并将大量計算資料、模型與成果公開與同行分享,為疾病防治及藥物研發提供支援。
最新的好消息是,抗瘧疾藥磷酸氯喹可能成為新冠肺炎的破局之藥。
該藥物在臨床試驗中被證明對新型冠狀病毒肺炎(COVID-19)具有良好的治療效果,但其治療機理和分子機制尚不清晰。
晶泰科技對氯喹可能的作用機制進行分子動力學模拟,驗證了該藥物對病毒的一種作用機制,并發現其新的潛在治療機理,為抗疫藥品開發與優化提供研究基礎與科學參考。目前,晶泰科技正與衆生藥業合作,推進體外實驗驗證。
在本次抗冠藥物研發中,阿裡雲在晶泰科技背後提供了大量的免費算力支援。每一次的分子動力學模拟背後,都離不開高性能計算。
阿裡雲免費開放算力,加速新冠藥物研發
高性能計算(High Performance Computing,簡稱HPC),常被稱為“超算”,是當代虛拟藥物研發的重要支撐。
以老藥新用為例。從已有的藥物裡面,找到能治療新冠的藥是最快的方式。若研制新藥,則會涉及到後續的大量臨床實驗和藥監局審批,遠水救不了近火。

要找到阻礙病毒的正常活動的化合物,以往的方法是通過大量實驗做篩選,費時又費力。如今,科學家嘗試通過機器模拟分子化合物與靶點的互相作用,進而篩選出可能有效的化合物做實驗,進而擴大搜尋範圍,提高篩選針對性,節約研發時間,将有限的實驗資源應用到最有可能成功的候選藥物上。
首先要了解靶點與化合物作用的意義,如能找到幹擾病毒複制的化合物(藥物),就能抑制病毒對機體的傷害。
比如,病毒蛋白在合成過程中,需要蛋白酶的介入,如3CLpro蛋白酶和PLpro蛋白酶,抑制蛋白酶的功能就是抑制病毒的方法之一。
病毒體内能夠被其它物質識别或結合的結構,被稱為靶點(Biological Target)。如果找到能夠與這個靶點結合的小分子藥物,就能阻礙蛋白酶水解酶前體多聚蛋白,無法釋放病毒RNA複制所需的聚合酶與解螺旋酶,進而改變其功能,阻礙病毒蛋白合成,導緻病毒無法複制,實作抑制病毒複制的效果。
晶泰科技通過藥物模拟算法,從2900個已準許上市藥物與10000個中藥分子中找到183個有潛在抑制新冠病毒3CLpro和PLpro靶點的藥物,又經過高精度篩選,用分子動力學方法精确模拟計算藥物化合物與病毒靶點間的親和力,将這一清單縮小到38個藥物,這一系列預測需要完成大量高精度的計算。
如此級别的高精度計算,所需要耗費的計算資源超乎想象。若用一台電腦(1張GPU卡),一天隻能完成8-10個分子的計算模拟,至少幾十天才能完成一次篩選。
晶泰科技在雲計算的幫助下,将這一過程從一個多月縮短到了一周,進而節約了寶貴的研發時間,将藥物體外實驗的程序大大提前。于此可見大算力的重要性,雲端高性能計算為能相關場景提供大規模算力。
疫情的肆虐使得算力供不應求,為了抗擊疫情,1月29日,阿裡雲宣布向全球公共科研機構免費開放高性能計算平台、CPU/GPU叢集及AI算力。
阿裡雲陸續支援了超過10家一線抗疫科研機構,涵蓋了藥物研發、CT醫學圖像AI診斷等抗疫一線急需解決的問題,晶泰科技亦是其中一家獲支援機構。
研究氯喹的作用前,晶泰科技就利用雲計算完成了部分研究:從分子層面了解病毒感染機理,判定出未來同類病毒的人際傳播風險;通過高精度計算,預測病毒及其突變對傳染性和緻病性的影響;獲得阿裡雲高性能計算平台提供的公益算力後,晶泰科技北京人工智能藥物研發中心很快完成針對全球已上市藥物小分子及中藥分子的老藥新用篩選,目前正在進行實驗驗證,并繼續支援廣譜抗冠狀病毒新藥的研究。
利用自動伸縮,節省成本與運維工作量
晶泰科技在本次疫情中與阿裡雲合作流暢,推進迅速,得益于此前持續合作建立的基礎。
晶泰科技從成立伊始就對雲情有獨鐘,源于其在藥物發現、開發中用量子實體、人工智能對藥物關鍵性質進行模拟的商業場景,對高性能計算算力的需求有時間不定期、規模不定量的特點。
若購買了固定的算力,波谷時期意味着企業成本浪費;而在疫情這般非常時期,藥物研究是一場與時間的賽跑,固定算力的天花闆也會限制科學家的研究效率。
雲超算的彈性與此不謀而合。去年春天,晶泰科技已開始對阿裡雲超算平台進行測試使用,它可以根據自身需求随用随買,不過晶泰科技時大時小的算力需求,若人肉運維依然繁瑣。
為此,阿裡雲超算的技術人員開發了基于HPC作業負載的自動伸縮服務,可根據叢集排程器中作業負載情況,自行幫助晶泰科技進行計算節點的申請和釋放,調整硬體計算資源,幫助使用者優化資源成本。
比如,當叢集中沒有排隊作業,但仍有空閑節點時,自動伸縮将會放空閑節點,進而降低節點空置率。反之則根據排程器中排隊作業的資源需求,按預先設定的政策自動擴容。
為了加快擴容時的軟體部署,阿裡雲超算還上線自定義鏡像功能,将擴容時間壓縮到1分鐘左右。
跨機房排程算力,縮短藥物研發時間
高度波動的算力需求,也給庫存與機型的排程帶來挑戰。
一般情況下,高性能計算叢集節點都位于同一資料中心内,而晶泰科技的研究,經常需要建立大規模的GPU叢集,其GPU需求量一旦觸及波峰,時而面臨單個資料中心無法滿足的情況,這限制了其藥物研發時間。
于是,阿裡雲超算團隊的工程師實作了基礎設施的互通,為晶泰科技設計了跨資料中心的資源排程方案,實作快速響應晶泰科技的機型供給需求,即使在算力緊張時也能幫助科學家大大縮短計算時間,加快藥物研究。
優化軟體環境,提高運算性能
在生物制藥行業,Gromacs是分子動力學模拟(Molecular Dynamic Simulation)常用到的開源軟體,在本次新冠病毒研究中,自然是必不可少的利器。
阿裡雲超算平台早先便對Gromacs做了內建,提供多節點并行和GPU加速等多個軟體版本,使用者隻需通過簡單的勾選操作,就可以輕松完成Gromacs在雲超算叢集上的快速部署。
阿裡雲還可以根據客戶Gromacs軟體的使用情況,通過針對性的軟體調優,來進一步加速分子動力學模拟計算過程。
從軟體底層數學庫、多節點并行通訊庫,程序/線程配比及計算任務配置設定等多個角度進行調優,阿裡雲超算團隊可以通過有效加速Gromacs軟體計算過程,實作20%的性能提升。目前,阿裡雲正與晶泰科技進行溝通,确定在指定算例上分别加速Gromacs CPU版本和GPU版本的性能調優目标,在下一階段的藥物研究中進一步為其加速。
此外,晶泰科技還應用了容器Docker技術,将晶泰科技内部的軟體和算法包裝到docker裡面,一般的高性能計算很少使用。
阿裡雲超算則配備了高性能容器應用服務,晶泰科技隻需要打包好需要容器應用,上傳到阿裡雲容器鏡像庫裡,即可就輕松直接部署在叢集中,節省了相關環境改造工作。
新冠疫情仍未過去,跟病毒的戰争仍在繼續。如今,晶泰科技正加速推進體外實驗驗證,阿裡雲的工程師們正連軸轉支援着各醫療機構的藥物研發,可喜的是,階段性進展次第公布,相信未來能聽到更多的好消息。
智能防控總決戰,大AI無疆快診斷,阿裡雲線上分享“人工智能助力疫情防控——新冠肺炎AI輔診平台全面開放”,
“阿裡雲暖春行動”線上課堂請點選檢視。
如需了解更多,也可以發郵件到[email protected]
本文來源:醫谷微信公衆号