天天看點

基于煉丹神器深度學習下的生命科學冷凍電鏡單細胞基因分析的解決方案

基于煉丹神器深度學習下的生命科學冷凍電鏡單細胞基因分析的解決方案

生命科學 | 冷凍電鏡 | 蛋白質結構

深度學習 | 基因測序 | 卷積神經網絡

目前随着冷凍電鏡、蛋白質組學、深度學習、基因測序、卷積神經網絡、高性能計算、單細胞基因、資料挖掘、資料分析、靶點發現、晶體預測、AlphaFold等技術的快速發展,生命科學開始被逐漸被人們所重視。

生命科學行業涉及研究微生物、動植物等一切生物的科學領域,也包括生命倫理學等相關領域的考量。生命科學的研究對提高人類生活品質有很大幫助。從全球範圍來看,21世紀以來,全球生命科學發展進入快車道,特别是人類基因組計劃的實施、幹細胞研究的深入、克隆技術的不斷發展等因素将生命科學的發展推向了新的高度,同時相應領域的研發投入也在不斷增加。作為強烈依賴科技資訊技術的典型代表,生命科學行業的藥物研發和基因測序分析領域面臨着計算資源短缺、研發周期長等問題。

基于煉丹神器深度學習下的生命科學冷凍電鏡單細胞基因分析的解決方案

生命科學領域面臨的挑戰

清華大學生命科學學院生物計算平台主管楊濤認為:冷凍電鏡目前在科研方向的挑戰分别是:資料管理的挑戰,科研進度的挑戰和實驗風險的挑戰。

一、資料管理

源于超量資料,在最大化壓縮的前提下,每天大約會産生4TB的資料量。為了使計算裝置的效率最大化,需要365天不間斷工作。一年的資料總量非常驚人,給資料管理帶來巨大的挑戰。

二、科研管理

冷凍電鏡技術已經備受認可,各科研機構都在調動資源搶占高地,是以存在時間效率的問題,哪怕比别人慢半天,都會失去首發的價值。

三、實驗風險

這是一個非常長時間的實驗流水線,任何中間環節都存在風險。一旦不能及時解決風險,整個系統的産出就會大打折扣。

基于煉丹神器深度學習下的生命科學冷凍電鏡單細胞基因分析的解決方案

客戶需求

某學院單細胞基因組研究技術中心(簡稱“該中心”)旨在建立标準化、自動化的工程技術,提高單細胞結構分析水準,高精度确定從蛋白質分子到全細胞的三維結構,并在此基礎上揭示蛋白質及其複合體功能,大規模制備蛋白/抗體,建成具有國際一流水準和綜合示範功能的蛋白質科學研究核心基地。

就生命科學研究項目而言,每個項目涉及的資料量小在上百TB。對于時間周期長、領域廣的項目,未來資料需求可能在PB級。此外,該中心需要考慮支援多種生命科學研究項目,而其中,不同應用對高性能平台計算環境有不同的要求,如基因測序需要高I/O性能和記憶體大消耗,而分子動力學研究除了I/O性能外,還需要較高的網絡和并發處理能力。所有這些都對該中心建構高性能平台提出了挑戰:

一、資料量增長10多倍,計算能力也要“跟上”

研究團隊采用的冷凍電鏡技術在近兩年取得了革命性的進展,具體來說就是相機技術實作了飛躍,采集資料的能力提高了10多倍,甚至上百倍,進而使得研究蛋白質結構的源資料呈幾何級數增長,這就需要中心在後期全面提升資料處理和計算能力。

二、亟需簡化管理保障服務品質

随着生命科學研究項目越來越多,如何根據不同項目和研究人員個性化需求配置設定資源,及時回收資源,實作跨整個高性能資源池的集中統一管理,簡化維護管理,減輕運維人員負擔,是科研高性能計算平台普遍面臨問題。

三、TCO居高不下

生命科學研究迅速成為國家戰略發展方向,導緻研究項目和跨學科研究需求快速增加。傳統的分層計算存儲資源使用率低,導緻新增費用快速增加。此外,能耗也成為阻礙高性能計算中心擴充的不可逾越的“高牆”。

四、網絡性能不能拖後腿

作為保證高性能叢集正常運作的關鍵,高性能網絡承擔着重要的連接配接任務。随着單節點計算和存儲性能的不斷提升,高性能使用者需要萬兆,四萬兆,十萬兆,InfiniBand網絡選擇以滿足不同的高性能計算需求。

基于煉丹神器深度學習下的生命科學冷凍電鏡單細胞基因分析的解決方案

解決方案特點

藍海大腦基于融合架構助力某學院單細胞基因組研究技術中心搭建了一個分布式高性能平台,擁有250個實體計算節點,5000個計算核心,總存儲容量1.92PB,理論計算能力208Tflops。通過Lustre技術實作了跨20個融合架構的集中統一管理。

一、4.1TFLOPS/U的計算密度,4倍性能提升

可針對不同項目量身定制配置。其中,高密度計算節點支援14核英特爾®至強TM E5-2600v3處理器,在2U中擁有224個計算核心的密度,單U空間的計算性能密度達到業界領先的4.1TFLOPS,同時支援64個DIMM高密度記憶體,確定高性能和低延遲的性能要求。此外,還支援InfiniBand接口,非常适合要求超低延遲的工作負載。在強大計算能力的保證下,計算效率提升3-4倍,過去4-5天才能完成的計算任務,一天就能完成。

二、簡化高性能資源池監控管理

根據項目要求定制不同的系統配置,同時通過機箱管理控制器(CMC),可以集中監控和管理20個FX系統。此外,無代理生命周期管理和一對多遠端管理功能可確定BIOS和固件程式更新不會影響業務穩定性,并提高系統中計算節點生命周期管理的效率。而且在擴充伺服器時,IT人員可以通過下發配置檔案,使系統自動更新BIOS和固件程式,避免了重複輸入配置參數的繁瑣過程,減少了人工輸入錯誤導緻的系統故障,簡化了管理運維,降低了管理費用。

三、TCO降低約20%

自動化、高密度、低能耗的內建部署、集中統一管理,可以使中心的TCO降低20%左右。其中,藍海大腦将通過主機闆連接配接伺服器、存儲和1G0b網絡,通過子產品化設計形成融合一體機,同時提供散熱、供電、網絡、管理和PCIe擴充的共享插槽,降低資料中心的占地和能耗,幫助中心獲得良好的成本效益。

四、高速網絡保障平台I/O性能

藍海大腦為中心提供四萬兆高性能網絡,在保持成本優勢的基礎上,為使用者提供穩定的網絡性能,保證高性能、低延遲要求。

五、打破原有的伺服器散熱方式,采用液冷散熱

藍海大腦液冷伺服器系統突破傳統風冷散熱模式,采用風冷和液冷混合散熱模式——伺服器内主要熱源 CPU 利用液冷冷闆進行冷卻,其餘熱源仍采用風冷方式進行冷卻。通過這種混合制冷方式,可大幅提升伺服器散熱效率,同時,降低主要熱源 CPU 散熱所耗電能,并增強伺服器可靠性。經檢測,采用液冷伺服器配套基礎設施解決方案的資料中心年均 PUE 值可降低至 1.2 以下。

基于煉丹神器深度學習下的生命科學冷凍電鏡單細胞基因分析的解決方案

客戶收益

一、藍海大腦HPC高性能計算與AI平台已成為高性能、多功能、專業的前沿計算平台,尤其在AI深度學習方面,為校内外生物學研究提供高效的計算支援。同時為計算生物學、深度學習、基因測序等多個研究組提供計算服務。包括測序儀的離線處理、序列搜尋比對分析、分子動力學模拟、計算機輔助藥物設計和分子對接、生物網絡的計算。

繼續閱讀