天天看點

ISC24 | NVIDIA 和 Recursion 利用 AI 超級計算機加快新藥研發

作者:NVIDIA英偉達中國

BioHive 由 NVIDIA AI 驅動,用于加速醫療領域科學家的工作。在全球超級計算機 TOP500 榜單中,它的排名上升了 100 多位。

ISC24 | NVIDIA 和 Recursion 利用 AI 超級計算機加快新藥研發

圖注:BioHive-2 與 Recursion 公司的員工。從左至右:Paige Despain、John Durkin、Joshua Fryer、Jesse Dean、Ganesh Jagannathan、Chris Gibson、Lindsay Ellinger、Michael Secora、Alex Timofeyev 和 Ben Mabey。

BioHive-2 在 Recursion 公司的鹽湖城總部首次亮相,它被稱為制藥行業最大的超算系統。在最新一期的全球超級計算機 TOP500 榜單中,BioHive-2 位列 35,排名比其上一代上升 100 多位。

這一進展代表了該公司最近利用 NVIDIA 技術來加速藥物發現所做的努力。

Recursion 首席技術官 Ben Mabey 表示:“我們看到,就像大語言模型一樣,使用更多資料和算力擴大訓練規模可以大幅提升生物學領域 AI 模型的性能,這最終會對患者的生活帶來積極的影響。” Ben Mabey 十多年來一直在探索将機器學習用于醫療領域。

BioHive-2 搭載了 504 個 NVIDIA GPU,并通過 NVIDIA Quantum-2 InfiniBand 網絡互聯,可提供 2 exaflops 的 AI 性能。NVIDIA DGX SuperPOD 是以比 Recursion 的初代系統 BioHive-1 快近 5 倍。

高性能解決複雜性挑戰

性能對快速進步很關鍵,因為“生物學極其複雜”,Mabey 說。

找到一種新的候選藥物可能需要科學家花費數年時間,在濕實驗室進行數百萬次實驗。

這項工作至關重要。Recursion 的科學家每周運作超過 200 萬次這樣的實驗。但今後,他們将使用 BioHive-2 上的 AI 模型,将他們的平台引導到最有前景的生物學領域來運作實驗。

他說:“有了 AI,我們現在隻需 40% 的濕實驗室工作就能獲得 80% 的價值,而且這一比例未來将進一步提高。”

生物學資料推動醫療 AI 不斷進步

Recursion 正在與拜耳(Bayer AG)、羅氏(Roche)和基因泰克等生物制藥公司合作。Recursion 積累了超過 50 PB(petabyte)的生物、化學和患者資料庫,并由此開發了諸多可加速藥物發現的強大 AI 模型。

Mabey 在七年多前加入 Recursion,部分原因是該公司緻力于打造這樣的資料集。他表示:“這是世界上最大的生物資料集之一,在建構之初就考慮到 AI 訓練,并且涵蓋了生物和化學資料。”

創造 AI 氛圍

通過在 BioHive-1 上處理這些資料,Recursion 開發了一系列基礎模型,稱為 Phenom。這些模型将一系列顯微鏡觀測到的細胞圖像轉化為有意義的表示,用于了解其中深層的生物學。

其中一個模型 Phenom-Beta 現已認證雲 API 的形式提供,也是 NVIDIA BioNeMo(一個面向藥物發現的生成式 AI 平台)上的首個第三方模型。

經過幾個月的研究和疊代,BioHive-1 使用超過 35 億張細胞圖像來訓練 Phenom-1。Recursion 擴充後的系統能夠在更短的時間内用更大的資料集訓練出更強大的模型。

該公司還利用由 Oracle 雲基礎設施托管的 NVIDIA DGX Cloud,為其工作提供額外的超算資源。

ISC24 | NVIDIA 和 Recursion 利用 AI 超級計算機加快新藥研發

圖注:就像訓練大語言模型來生成句子中缺失的單詞一樣,Phenom 模型在訓練時被要求生成細胞圖像中被屏蔽的像素。

Phenom-1 模型以多種方式為 Recursion 及其合作夥伴服務,包括尋找和優化治療各種疾病和癌症的分子。早期模型已經幫助 Recursion 預測了治療新冠肺炎的候選藥物,10 次中有 9 次成功。

Recursion 去年 7 月宣布與 NVIDIA 合作。不到 30 天後,BioHive-1 和 DGX Cloud 的結合成功篩選并分析了一個龐大的化學庫,預測大約 360 億種化合物的蛋白質靶點。

今年 1 月,Recursion 展示了 LOWE,這是一個擁有自然語言界面的 AI 工作流引擎,它可以幫助科學家更輕松地使用該公司的工具。今年 4 月,該公司還描繪了一個自主開發的十億參數 AI 模型,該模型旨在為預測醫療領域關鍵分子的性質提供一種全新方法。

Recursion 采用 NVIDIA 軟體來優化系統。

他說:“我們喜歡 CUDA 和 NVIDIA AI Enterprise,并且正在研究 NVIDIA NIM 是否能夠幫助我們更輕松地在内部以及向合作夥伴釋出我們的模型。”

共同的醫療願景

在與 Recursion 董事長的爐邊談話中,NVIDIA 創始人兼首席執行官黃仁勳描述了“模拟生物學”願景,而這些成果讓實作該願景更進了一步。

黃仁勳表示:“你現在可以識别和學習幾乎任何有結構的物體的語言,也可以将其轉化成任何有結構的物體……這就是生成式 AI 革命。”

Mabey 說:“我們的看法相似。”

他補充道:“我們正處于一個非常有趣的時代的早期階段,就像計算機加速了晶片設計一樣,AI 也可以加快藥物設計。生物學要複雜得多,是以需要數年時間才能看到成果。但回過頭來看時,人們會發現這是醫療領域的一個真正轉折點。”

了解 NVIDIA 面向醫療和生命科學的 AI 平台:

并訂閱 NVIDIA 醫療新聞:

繼續閱讀