天天看点

ISC24 | NVIDIA 和 Recursion 利用 AI 超级计算机加快新药研发

作者:NVIDIA英伟达中国

BioHive 由 NVIDIA AI 驱动,用于加速医疗领域科学家的工作。在全球超级计算机 TOP500 榜单中,它的排名上升了 100 多位。

ISC24 | NVIDIA 和 Recursion 利用 AI 超级计算机加快新药研发

图注:BioHive-2 与 Recursion 公司的员工。从左至右:Paige Despain、John Durkin、Joshua Fryer、Jesse Dean、Ganesh Jagannathan、Chris Gibson、Lindsay Ellinger、Michael Secora、Alex Timofeyev 和 Ben Mabey。

BioHive-2 在 Recursion 公司的盐湖城总部首次亮相,它被称为制药行业最大的超算系统。在最新一期的全球超级计算机 TOP500 榜单中,BioHive-2 位列 35,排名比其上一代上升 100 多位。

这一进展代表了该公司最近利用 NVIDIA 技术来加速药物发现所做的努力。

Recursion 首席技术官 Ben Mabey 表示:“我们看到,就像大语言模型一样,使用更多数据和算力扩大训练规模可以大幅提升生物学领域 AI 模型的性能,这最终会对患者的生活带来积极的影响。” Ben Mabey 十多年来一直在探索将机器学习用于医疗领域。

BioHive-2 搭载了 504 个 NVIDIA GPU,并通过 NVIDIA Quantum-2 InfiniBand 网络互联,可提供 2 exaflops 的 AI 性能。NVIDIA DGX SuperPOD 因此比 Recursion 的初代系统 BioHive-1 快近 5 倍。

高性能解决复杂性挑战

性能对快速进步很关键,因为“生物学极其复杂”,Mabey 说。

找到一种新的候选药物可能需要科学家花费数年时间,在湿实验室进行数百万次实验。

这项工作至关重要。Recursion 的科学家每周运行超过 200 万次这样的实验。但今后,他们将使用 BioHive-2 上的 AI 模型,将他们的平台引导到最有前景的生物学领域来运行实验。

他说:“有了 AI,我们现在只需 40% 的湿实验室工作就能获得 80% 的价值,而且这一比例未来将进一步提高。”

生物学数据推动医疗 AI 不断进步

Recursion 正在与拜耳(Bayer AG)、罗氏(Roche)和基因泰克等生物制药公司合作。Recursion 积累了超过 50 PB(petabyte)的生物、化学和患者数据库,并由此开发了诸多可加速药物发现的强大 AI 模型。

Mabey 在七年多前加入 Recursion,部分原因是该公司致力于打造这样的数据集。他表示:“这是世界上最大的生物数据集之一,在构建之初就考虑到 AI 训练,并且涵盖了生物和化学数据。”

创造 AI 氛围

通过在 BioHive-1 上处理这些数据,Recursion 开发了一系列基础模型,称为 Phenom。这些模型将一系列显微镜观测到的细胞图像转化为有意义的表示,用于理解其中深层的生物学。

其中一个模型 Phenom-Beta 现已通过云 API 的形式提供,也是 NVIDIA BioNeMo(一个面向药物发现的生成式 AI 平台)上的首个第三方模型。

经过几个月的研究和迭代,BioHive-1 使用超过 35 亿张细胞图像来训练 Phenom-1。Recursion 扩展后的系统能够在更短的时间内用更大的数据集训练出更强大的模型。

该公司还利用由 Oracle 云基础设施托管的 NVIDIA DGX Cloud,为其工作提供额外的超算资源。

ISC24 | NVIDIA 和 Recursion 利用 AI 超级计算机加快新药研发

图注:就像训练大语言模型来生成句子中缺失的单词一样,Phenom 模型在训练时被要求生成细胞图像中被屏蔽的像素。

Phenom-1 模型以多种方式为 Recursion 及其合作伙伴服务,包括寻找和优化治疗各种疾病和癌症的分子。早期模型已经帮助 Recursion 预测了治疗新冠肺炎的候选药物,10 次中有 9 次成功。

Recursion 去年 7 月宣布与 NVIDIA 合作。不到 30 天后,BioHive-1 和 DGX Cloud 的结合成功筛选并分析了一个庞大的化学库,预测大约 360 亿种化合物的蛋白质靶点。

今年 1 月,Recursion 展示了 LOWE,这是一个拥有自然语言界面的 AI 工作流引擎,它可以帮助科学家更轻松地使用该公司的工具。今年 4 月,该公司还描绘了一个自主开发的十亿参数 AI 模型,该模型旨在为预测医疗领域关键分子的性质提供一种全新方法。

Recursion 采用 NVIDIA 软件来优化系统。

他说:“我们喜欢 CUDA 和 NVIDIA AI Enterprise,并且正在研究 NVIDIA NIM 是否能够帮助我们更轻松地在内部以及向合作伙伴发布我们的模型。”

共同的医疗愿景

在与 Recursion 董事长的炉边谈话中,NVIDIA 创始人兼首席执行官黄仁勋描述了“模拟生物学”愿景,而这些成果让实现该愿景更进了一步。

黄仁勋表示:“你现在可以识别和学习几乎任何有结构的物体的语言,也可以将其转化成任何有结构的物体……这就是生成式 AI 革命。”

Mabey 说:“我们的看法相似。”

他补充道:“我们正处于一个非常有趣的时代的早期阶段,就像计算机加速了芯片设计一样,AI 也可以加快药物设计。生物学要复杂得多,因此需要数年时间才能看到成果。但回过头来看时,人们会发现这是医疗领域的一个真正转折点。”

了解 NVIDIA 面向医疗和生命科学的 AI 平台:

并订阅 NVIDIA 医疗新闻:

继续阅读