什么样的底层逻辑导致AlphaFold 3的惊人突破？

2024年5月8日，DeepMind团队在《自然》期刊上发表了一篇《利用AlphaFold 3对生物分子相互作用进行精确结构预测》的文章。这是继2024年1月17日发布“能够解决奥数级别的平面几何难题”的人工智能AlphaGeometry之后，DeepMind在《自然》期刊上发布的最新一款专门解决某一类特定问题的人工智能。

蛋白质由蛋白质一级结构组成，蛋白质折叠的过程中蛋白质会自发折叠形成蛋白质三级结构。蛋白质结构对蛋白质生物学功能至关重要。然而，了解氨基酸序列如何确定蛋白质三级结构极具挑战性，这被称为“蛋白质折叠问题”。

蛋白质折叠

这次的AlphaFold 3，是DeepMind发布的AlphaFold系列人工智能程序的最新版本。正如AlphaFold的名字“阿尔法折叠”所说的那样，AlphaFold系列在设计之初，是一款用于预测蛋白质结构的人工智能。

在2020年11月的第14届CASP（蛋白质结构预测技术的关键测试，Critical Assessment of protein Structure Prediction）竞赛中，AlphaFold 2的中位分数为92.4（满分100分）。其准确度远远高于其他任何程序。

随后，AlphaFold 2，及其对所有已知 DNA 序列的 2 亿种蛋白质的预测结构的数据库向科学家免费开源开放。据DeepMind公司蛋白质结构团队负责人、高级研究员约翰·朱珀所说：“AlphaFold 2已在其他发表的科学论文中被引用了2万多次，并被用于研究治疗疟疾、癌症和许多其他疾病的药物。”

在生物制药领域，AlphaFold大大降低了获取蛋白质结构的时间和成本，加速了基于蛋白质结构的药物研发。现任诺华生物医学研究所所长菲奥娜·马歇尔夸张地表示：“AlphaFold使每个人都成为了结构生物学家。”

转录因子和核糖体RNA分子结构模型。视觉中国|图

尽管AlphaFold 2有着如此惊人的表现，但是要将AlphaFold 2的数据真正用于药物设计等具体现实应用当中，还有着不小的距离。这是因为，AlphaFold 2本身有着很大的局限性。

正如前文所说，AlphaFold 2的功能，在于预测蛋白质的结构和怎样进行折叠。虽然了解蛋白质的形状和结构通常是理解其功能的关键部分。但在包括人体在内的生物体当中，蛋白质并不是孤立运作的。而影响蛋白质功能的，除了蛋白质的三维结构之外，还有蛋白质与各种其他分子的相互作用。但是，AlphaFold 2无法预测蛋白质与其他类型分子，例如生物体内的DNA、RNA、配体和离子之间的相互作用。它也无法预测这些其他分子之间的相互作用。另外，AlphaFold 2也不能确定所预测的蛋白质结构处于何种构象状态。其预测结构的精度也存在不确定性，即使同一个蛋白质的不同区域的预测精度也可能不同。这些都限制了AlphaFold 2的实用性。

巨大的提升

DeepMind新发布的AlphaFold 3，则在这些方面都有了巨大的提升和改进。

根据DeepMind 和同构实验室（Isomorphic Lab）的测试，在蛋白质之间的相互作用方面，AlphaFold 3的预测准确率达到了62%，相较于AlphaFold 2提升了一倍。不仅如此，相较于只能对蛋白质之间的相互作用进行预测的AlphaFold 2，AlphaFold 3可以预测蛋白质与DNA、RNA链、配体和离子等小分子的相互作用，以及这些小分子彼此之间的相互作用。论文指出，该模型可以精确预测“包含蛋白质数据库中几乎所有分子类型的复合物”。

在准确性方面，在对蛋白质与小分子之间的相互作用的预测上，AlphaFold 3的准确率达到了76%，而之前的最佳预测软件只有52%。在DNA之间相互作用的预测上，AlphaFold 3的准确率达到了65%，而之前的最佳预测软件只有28%。

AlphaFold 3的巨大提升，是近几年人工智能领域各种惊人进展的一个典型代表。它的表现，也体现了近几年人工智能领域的最新发展与成果。

相较于之前的AlphaFold 2，AlphaFold 3的主要改进包括，大大简化了之前的多重序列比对（Multiple sequence alignment，MSA）流程；将之前的Evoformer替换成了Pairformer；将结构模块（Structure Module）替换成了扩散模块（Diffusion Module）。

这些改进，大幅提升了AlphaFold 3的效率。更为重要的是，它改变了AlphaFold 3的运作方式。在AlphaFold 2上，预测蛋白质结构的方式，是基于蛋白质的物理和化学特性，去模拟蛋白质折叠的方式。这种做法，就导致AlphaFold 2在很多时候效率偏低，准确性不高，而且仅能用于蛋白质的预测。

而AlphaFold 3所使用的扩散模块，则是基于完全不同的逻辑来实现预测的。

扩散模型，是现今深度生成模型中最先进的。即所谓的SOTA model：state-of-the-art model。在计算机视觉、自然语言处理、波形信号处理、多模态建模、分子图建模、时间序列建模、对抗性净化等诸多领域当中，扩散模型均有出色的表现。稍早前OpenAI发布的，能以文本描述生成视频的人工智能模型SORA，就是基于扩散模型的。

就像SORA可以通过训练，生成在绝大多数情况下符合现实世界物理规律的视频一样。使用了扩散模块的AlphaFold 3也可以通过训练，直接生成包括蛋白质在内的生物分子的结构。也就是说，AlphaFold 3不再模拟蛋白质折叠的过程，而是直接从原子层面确定生物分子中每个原子的位置坐标，进而生成整个分子的结构。

这一改变，就使得AlphaFold 3的适用范围不再局限于预测蛋白质的结构和相互作用，而可以用于模拟预测包括DNA、RNA、配体等生物分子，以及包括离子在内的小分子的结构，以及它们之间的相互作用。

正如英伟达高级科学家范麟熙（Jim Fan）在个人社交媒体上所说的：“AlphaFold 3是人工智能在生物学领域迭代出的最新最大的突破。它的新特点是，AlphaFold 3利用扩散来‘渲染’分子结构，然后通过去噪从模糊的原子云中逐渐得出分子的具体结构。”

对于AlphaFold 3的巨大提升，DeepMind的首席执行官德米斯·哈萨比斯（Demis Hassabis）在5月7日宣布这一突破的发布会上说：“对我们来说，今天宣布AlphaFold 3是一个重要的里程碑。生物学是一个动态系统，你必须了解生物学中的各种特性是如何通过细胞中不同分子之间的相互作用而产生的。你可以把AlphaFold 3看作是我们朝着这个方向迈出的第一大步。”

哈萨比斯还乐观地表示，在未来几年内，第一批由人工智能设计的药物就将投入临床使用。

还需要改进

需要指出的是，虽然AlphaFold 3相较于之前有了巨大的提升和改进，但是它仍然有着一些需要改进的地方。

这其中，影响最大的一个问题，就是所谓的人工智能的“幻觉”。现阶段包括GPT、SORA在内的，基于深度学习训练而成的大型人工智能模型，都或多或少地存在着“幻觉”现象。即人工智能会生成无意义或者错误的内容。而使用生成式扩散模型，本身就很容易产生幻觉。这对于主要用于日常对话和生成视频的GPT和SORA来说，或许只是一些“无伤大雅”的小问题。但是，对于AlphaFold 3这样，真正的用途是用于生物学研究和制药领域的人工智能来说，生成“看上去似乎合理的结构”这样的错误将是无法接受的。

对于这一点，DeepMind团队采取了所谓的交叉蒸馏的方法。即在预训练数据集中加入之前版本的AlphaFold-Multimer v2.3预测的结构，让AlphaFold 3来学习。进而减少AlphaFold 3的幻觉行为。和AlphaFold 2一样，DeepMind也在AlphaFold 3中加入了置信度组件。AlphaFold 3在给出的预测结构中，会标注对不同部位的可信度，来供使用者识别。

除此之外，对于蛋白质等大分子来说，在结构化学中有一个很特殊的性质，叫做手性。它指的是，某些分子结构，像左右手一样，看上去是镜像对称的。在某些反应中，具有手性对称的同分异构体，会呈现出不同的反应结果。这就使得在进行蛋白质等分子结构的预测中，必须要严格区分手性。但是，DeepMind的论文指出，尽管采取了各种方法，AlphaFold 3在预测中仍然有4.4%的可能性会违反手性。

除此之外，DeepMind的论文还指出，在一些预测结果中，AlphaFold 3还出现了生成物中原子位置相互重叠的现象。

这些存在的问题表明，AlphaFold 3距离真正的能够解决人类疾病的人工智能，还有很长的路要走。而DeepMind在论文中明确提到的这些问题，也说明他们对AlphaFold 3的提升和局限性是有着清晰认识的。

正如中国科学院院士、结构生物学家颜宁在个人社交媒体上所说的：“我对AI的态度总结起来其实是俩字‘敬畏’，它的发展速度超乎想象。……这次的server版本我觉得是一个速度和准确度的平衡，正确率不是最好的。……但还是那句话，AI一定会越来越强大，如何拥抱新技术、问出更有意思的问题，才是相关科研工作者现在更关注的。”

不同于GPT、SORA这样泛用性的，看上去和我们日常生活非常接近的人工智能。从年初的AlphaGeometry，到最近的AlphaFold 3，再追溯到更早的AlphaGo，DeepMind团队所推出的，是专门解决某一个特殊问题的人工智能。这些特用型的人工智能，或者像AlphaGo和AlphaGeometry一样，在某些纯智力领域接近或者超过了人类智力的最高水平。或者像AlphaFold系列这样，在科学研究领域真正发挥了作用。

也许，这才是人工智能的正确打开方式。毕竟，我们是人，而人工智能，是我们创造的工具。

南方周末特约撰稿左力

责编朱力远