天天看点

设计蛋白:未来疫苗的起点

如图中的3D模型所示,新型新冠疫苗中含有一种合成的蛋白纳米颗粒,可以产生更强大的免疫保护。(蒂莫西·阿奇博尔德(Timothy Archibald)/图)

2020年4月一个星期五的深夜,莱克西·沃尔斯(Lexi Walls)独自一人在华盛顿大学的实验室里,紧张地等待着她一生中最重要的实验结果。作为一名年轻的结构生物学家,沃尔斯专门研究冠状病毒。她在此前的3个月里夜以继日地工作,试图研制出一种新型新冠病毒疫苗。沃尔斯正在研制的疫苗与之前所使用的任何疫苗都不同,它的有效成分并非源自自然界,而是由计算机构建的人造微蛋白组成。该类型疫苗的诞生标志着我们在生物学上进行再设计的能力获得了新的突破。

你可以将蛋白质看作复杂的“纳米机器”,它们通过与其他蛋白质不断地相互作用来执行生物的大多数任务,包括消化食物、抵抗入侵者、修复损伤、感知环境、传递信号、增强力量和创造思维等。蛋白质由氨基酸分子组成,它们会扭曲变形并折叠成极其复杂的3D结构。蛋白质这种折纸样形状由不同氨基酸的排列顺序和数量决定,这些氨基酸之间存在着不同的吸引力和排斥力。这些相互作用的复杂性之高以及作用范围之小(平均每个细胞中包含4200万个蛋白质),使得我们无法了解它们如何自发、可靠地从氨基酸序列转变成功能性蛋白。许多专家认为我们永远也无法弄清楚其中的规则。

但是,人工智能领域的新见解和新突破正在助力揭示蛋白质背后的秘密。科学家正在打造可以改变世界的生化工具。有了这些工具,我们可以利用蛋白质来构建纳米机器人,这些机器人可以与病原体进行战斗,或是向全身发送信号,或是分解毒性分子,或是捕获光线。总之,我们可以实现各种生物学的目标。

沃尔斯一直站在该研究方向的前沿。她于2019年10月完成了关于冠状病毒结构研究的博士论文,在当时,很少有人关注这个方向的研究。她说:“过去5年来,我一直试图说服其他人,对冠状病毒的研究很重要。在进行博士学位答辩时,我首先说的就是:‘我要告诉你们为什么这个病毒家族可能引起大流行,而我们还没有做好应对这种大流行的准备。’不幸的是,这最终成为了现实。”

2019年12月下旬,当武汉报道了一种新型肺炎时,沃尔斯就怀疑这是由冠状病毒引发的。2020年1月10日,新冠病毒(SARS-CoV-2)的基因序列向全世界公布,沃尔斯同她在华盛顿大学的导师,生物化学家戴维·维斯勒(David Veesler)熬夜分析了该基因序列。沃尔斯说她当时有一种强烈的直觉:“就像是,‘好吧,我们知道该怎么做,我们去做吧。’”

跟其他的冠状病毒一样,新冠病毒看起来像一个覆盖着刺突蛋白(spike protein)的球。每个刺突的末端都是一簇氨基酸,这一簇氨基酸被称为受体结合域(RBD),其排列和原子电荷能与人类细胞表面的受体蛋白完美配对。病毒的蛋白就像空间站对接一样,与细胞表面受体对接,而病毒就是利用这种连接方式进入细胞内部并进行复制。

由于RBD在病毒感染中起着关键作用,它成为了免疫系统中抗体攻击的主要目标,这些特异性抗体能与RBD结合并使其失效。但是,免疫细胞需要经过一段时间才能产生足量的有效抗体,而那时病毒通常已经对人体造成了一定的损害。

第一代新冠疫苗包括了已经投入使用的mRNA疫苗,该疫苗通过让体内表达病毒的刺突蛋白而发挥作用。不过此时刺突蛋白并没有与新冠病毒相连,免疫系统可以通过识别这些额外的刺突蛋白的RBD来制造抗体部队。但是,RBD会被刺突蛋白的其他部分周期性地隐藏,从而阻止该结构域被抗体识别和结合,这会减弱疫苗的免疫反应。此外,疫苗学家通常认为这种游离的刺突蛋白(免疫原)与天然病毒不完全一样,它并不能一直触发强烈的免疫反应,除非个体接种了大剂量的疫苗。但是使用大剂量的疫苗会增加医疗成本,甚至可能引发强烈的副作用。因此,尽管这类新冠疫苗的研发已经取得了一定成效,但是许多专家将这种类型的疫苗视为一种过渡技术。英国制药巨头葛兰素史克(GSK)公司的首席科学家兼疫苗研发主管里诺·拉波利(Rino Rappuoli)说:“很明显,仅仅递送一些病毒的天然蛋白是不够的。”目前大多数疫苗,包括供儿童和成人接种的流感疫苗,都含有这类蛋白,葛兰素史克也制造了很多这样的产品,但是它们也需要改造。“设计出比天然分子更好的免疫原势在必行。”拉波利说。

设计免疫原

对此,沃尔斯和维斯勒有一个想法:如果免疫系统只接触到RBD,而不是一个完整的刺突蛋白,那会发生什么?这样RBD就无法躲在任何保护结构后面了。“我们想把关键部分展示给免疫系统,”沃尔斯说,“然后说:‘嘿,免疫系统,这就是你要作出反应的地方!’”

这个想法面临着一个很直接的问题,那就是生物界不存在单独的RBD,而且这个片段太小且不常见,因此可能无法引起免疫系统的注意。但是沃尔斯和维斯勒知道这个问题可以在哪里得到解决,那就是街道另一头的华盛顿大学蛋白质设计研究所(Institute for Protein Design,IPD)的贝尔实验室。该研究所非常了解蛋白质折叠过程,可以设计和构建出数百个非常简单的小型蛋白质,这些蛋白质与在生物体中发现的任何蛋白质都不一样,它们可以折叠成一致的形状,并且具有可预测的功能。

2019年,来自IPD的生物化学家奈尔·金(Neil King)团队设计了两种表面带有互补电荷的微小蛋白质,当它们在溶液中混合时,这两种微小蛋白质会结合在一起并自组装成纳米颗粒。这些纳米颗粒的大小和病毒差不多,只需要对其进行简单的修改就可以完全实现定制化。在早期测试中,当科学家们在这些纳米颗粒上配置了20个来自呼吸道合胞病毒的刺突蛋白后,它们能触发显著的免疫反应。

沃尔斯和维斯勒认为,为什么不尝试将类似的纳米颗粒用作新冠疫苗的组分,并在颗粒表面用RBD代替整个刺突蛋白?此外,与灭活或减毒疫苗相比,这种基于蛋白质的纳米颗粒生产成本低、速度快,且在室温下很稳定、便于运输,不像脆弱的mRNA疫苗那样必须低温储存。

沃尔斯与IPD联系后,决定与纳米颗粒专家布鲁克·菲亚拉(Brooke Fiala)合作。菲亚拉曾与金共同开发了一个能展示60个RBD的纳米颗粒球模型。此外,他们还尝试了一些更大胆的操作,例如不再将RBD融合到纳米颗粒的表面,而是利用氨基酸短链拴住它们,就像放风筝一样。这使得免疫系统能从各个角度更好地“观察”RBD,并产生可以攻击RBD多个不同部位的抗体。

没有人知道这个策略是否真的能取得成功,于是就出现了文章开头的那一幕。在那一夜的三周前,沃尔斯和同事给一些小鼠注射了纳米颗粒疫苗,给另一些小鼠注射了含有常规刺突蛋白的疫苗。一段时间后,研究人员从小鼠身上抽取了血液,并将血液与新冠病毒假病毒混合,这是一种实验室中使用的更为安全的人造、非复制型病毒。这个实验的目的是观察已接种疫苗的小鼠是否已经产生可以追踪并中和假病毒的抗体。

但抗体需要一段时间才能发挥作用,这就是为什么沃尔斯周五深夜还在等待结果。她绝不可能回家而让整个周末都处于悬念之中。她的同事出门时都在祝她好运,维斯勒离开前让沃尔斯一有结果就立即给他发电子邮件。当时外面一片漆黑,实验室里异常寂静。终于到了查看结果的时候。沃尔斯启动了一台仪器,该仪器可以检测并数出附着在病毒颗粒上的抗体,她深吸一口气并瞥了一眼数字。

结果显示,接种了低剂量常规疫苗的小鼠对假病毒没有免疫作用;接种了高剂量常规疫苗的小鼠产生的抗体具有适度的中和作用,这与其他疫苗的效果相似;但是,在接种纳米颗粒疫苗的小鼠中,假病毒被完全中和,其中和效果是高剂量常规疫苗的10倍。即使只使用极小剂量的纳米颗粒疫苗,其也能保持该量级的中和效果。当时,沃尔斯看到了一种潜在的低成本、耐储藏、超强效的疫苗。沃尔斯快速打开电脑,向维斯勒发送了一封全文大写的电子邮件:“它们能中和病毒!”维斯勒立即回信道:“下一代新冠疫苗就在你手中!”

但这只是疫苗必须通过的多项测试中的第一项。从那时起,他们就必须开始证明疫苗能够保护小鼠免受活病毒的侵害,接着要进行非人灵长类动物试验,最终是人体临床试验(纳米颗粒疫苗在2021年年初进入了最后一个测试阶段)。在沃尔斯看到结果的那一刻,这已经成为了蛋白质设计领域的突破性象征,其预示着一项之前我们无法掌握的技术突然间到来了。换言之,我们正在学习塑造生命的基石。

尽管过去数十年来,遗传学革命的方向在不断发生转变,但其核心始终都是蛋白质,而基因只是制造蛋白质的简单代码。在基因序列中,三个DNA核苷酸能产生一个氨基酸,此外还有一些可以产生其他氨基酸的三联代码。细胞中有20种氨基酸能作为构成蛋白质的基石,每一种氨基酸都有独特的形状和功能,其中有些构象灵活;有些带正电,有些带负电;有些具有亲水性,有些具有疏水性。

我们的细胞每天都在按照遗传密码所规定的氨基酸序列来制造新的蛋白质,这些蛋白质能自发成形。了解蛋白质折叠的机制将使我们能够设计出新型药物,这些药物可以抑制错误蛋白质的功能或者替换掉它。此外,我们还能借此探索与畸形蛋白质有关的疾病的病因,比如阿尔茨海默病、帕金森病、亨廷顿病和囊性纤维化等。

但遗憾的是,由于蛋白质太小,即使我们使用功能强大的显微镜也无法知道它所在的纳米世界中发生了什么。我们不知道这些蛋白质是如何正确折叠的,更不用说去了解蛋白质错误折叠时会导致什么问题。在专用设备上制备一张蛋白质的高分辨率图像可能需要花费一年的时间和10万美元。我们目前只知道0.1%的蛋白质的结构,剩下的基本要靠猜。这就是为什么遗传学革命中心一直存在一个谜团:特定的基因序列与生理、心理特征有关,但我们不知道其中的原因。如果把基因看作起点,身体功能看作终点,对于连接两者的蛋白质结构,我们依然缺乏了解。

从理论上讲,我们是有可能根据基因序列去预测蛋白质的最终结构的。这项任务对于加深我们对个体的理解非常重要,2005年《科学》125周年特刊也将其列为最重要且未被回答的125个科学问题之一。但实际上,只有极少数简单蛋白质的结构才可能被预测出来。

戴维·贝克(David Baker)等结构生物学家已经推断出一些预测蛋白质结构的基本规则。贝克创立了IPD,沃尔斯和维斯勒就是从这儿获取了纳米颗粒。贝克的研究小组已经将一些评估准则整合到一个名为罗塞塔(Rosetta)的用于预测蛋白质结构的计算机程序中,并利用它们来制造一些小的蛋白质(通常含有几十个氨基酸)。他们的一些成功案例显示,该领域具有巨大潜力,比如制造出的微型“纳米笼”可以用于包裹药物并将药物运送到体内;另外,一些分子检测器可以在遇到表面具有特定氨基酸组合的细胞时触发警报,比如那些导致癌症的氨基酸组合。

但是,在生物体内发挥重要作用的蛋白质比上述例子要大得多,它们含有成千上万个氨基酸。每一种氨基酸都与相邻的十几个氨基酸相互作用,有些氨基酸之间会形成很牢固的键,甚至与钻石中的化学键类似,有些则把其他氨基酸推开。所有这些关系会根据临近的环境而变。因此,这种可能性很快就变成了天文数字,而我们的大脑和超级计算机长期以来都无法找到计算出蛋白质最终结构的公式。

人工智能的加入

由于对这个问题感到沮丧,一群计算生物学家早在1994年便决定举办竞赛来推动该领域的发展。在马里兰大学约翰·莫尔特(John Moult)的带领下,他们发起了国际蛋白质结构预测挑战竞赛(CASP)。

2018年第13届CASP,由IPD领导的最佳团队平均成绩接近50分。但他们被一个意外的参赛者击败:谷歌的DeepMind,其人工智能系统在2016年击败了世界最佳围棋选手。DeepMind的人工智能(AI)预测蛋白质的平均得分约为57分。

这一结果震撼了全世界的蛋白质工程实验室,但事实证明这只是2020年结果的预演。在2020年,DeepMind的预测结果几乎完全准确,对所有蛋白质预测结果的平均得分为92分。对于简单的蛋白,它几乎把每个原子都放到了正确的位置。但它最令人印象深刻的结果是对一些难度较高的蛋白质的预测,这些蛋白质让大多数团队感到困惑,没有一个团队得分高于20分,而DeepMind的得分高达80多分。

DeepMind团队已于2021年7月发布了方法论文,详细介绍了其中的工作原理。当然,有些方面我们可能仍然难以理解,因为人工智能可以识别出无法轻易用规则解释的微弱关系,不过科学家们已经有了大致的认识。为了预测氨基酸之间的相互作用,研究团队采用了一种被称为“注意力网络”的技术,该技术最近促进了人工智能在语言翻译方面的快速发展。就像蛋白质一样,语言可以被看作一个线性的信息串,会通过自我“折叠”产生意义。像“它”这个词,能在不同句子中有着完全不同的意义。当我们交流时,我们会不断地沿着这条线性字符串前后移动,然后关注一簇局部的词汇,以了解上下文中不同单词的含义。一旦我们了解了这个含义,我们就可以转到另一个相关段落,并根据新的信息理解这些单词。

DeepMind在解析蛋白质结构时也做了类似的事情,它会将注意力放在一个局部的氨基酸簇上,并尽可能多地了解它们之间的相互关系。例如,一些氨基酸对似乎能协同进化,这表明它们之间具有联系,并限制了它们在蛋白质中可能的位置。DeepMind会利用这些信息跳转到蛋白质的不同区域,并根据对第一个氨基酸簇的了解来分析其他区域。它会对蛋白质的所有区域进行多次迭代,最终将这些信息构建成一个3D点状云,用于表示每个氨基酸原子组分之间的关系。它基本上是将蛋白质当作一种新的外来语言来破解。

随着其他实验室开始利用DeepMind技术,蛋白质预测变得无处不在,这让我们根据想象的折叠方式获得真实世界中的蛋白质的试验周期大大缩短。库雷希说:“它会渗透到每一个地方。这将使蛋白质设计更高效。过去需要6个月才能完成的优秀设计,现在可能只需要几个星期。”

但DeepMind团队并不想朝应用科学领域发展,因此AI不会花费时间为所需的复杂蛋白质结构绘制蓝图,它对该领域的巨大贡献将是间接的。“他们的工作为揭示蛋白质的功能以及新蛋白质工程带来了光明前景。”加州理工学院的生物化学家弗朗西丝·阿诺德(Frances Arnold)说。阿诺德通过一种称为定向进化的方法改善了天然蛋白质的性能,因而获得了2018年的诺贝尔化学奖,“但他们还无法通过设计或改造蛋白质来为人类解决问题。”

未来,这项工作将落到世界各地研究蛋白质结构的科学家身上,他们现在正试图使用DeepMind技术来增强实验室塑造蛋白质的能力。“这是一个重大的突破,”贝克说,他的团队在比赛中再一次获得了第二名,“我认为,这将使目前进展良好的工作变得更好。”

用阿诺德的话来说,现在人们面临的最大问题就是新冠病毒。当它来袭时,贝克和同事就开始在蛋白质中寻找解决方案。他们先将新冠病毒的基因序列输入到蛋白质结构预测程序罗塞塔中,生成了一个3D模型,然后再仔细研究新冠病毒的弱点。和沃尔斯一样,他们将注意力放到了刺突蛋白的RBD上。但贝克没有试图制造刺激抗体产生的疫苗,而是想要制造出一种更好的抗体。他想要创造只有单一功能,即能像微型魔术贴一样捕获RBD的蛋白质。

未来疫苗

当下,有益的蛋白质设计领域吸引了越来越多的科研资源和人才,这些蛋白质可能会在未来进入你附近的诊所。当世界上许多人都在等待新冠疫苗时,沃尔斯的纳米颗粒就成为了一个有希望的候选者。

在成功中和小鼠细胞中的假病毒后,该疫苗的下一项重大试验是对抗真正的新冠病毒。为此,沃尔斯不得不将她的小鼠运送到北卡罗来纳大学的拉尔夫·S.巴里克(Ralph S. Baric)的实验室,巴里克是世界上最著名的冠状病毒研究人员之一,他的实验室具备处理活病毒所需的生物安全水平。巴里克见过许多候选疫苗,在2020年6月,沃尔斯收到他们发来的一封鼓舞人心的电子邮件:纳米颗粒疫苗的中和能力打破了他们以往的测试纪录。

“一切都比我们预想的还要好!” 沃尔斯说。当接触到真正的病毒时,小鼠的表现良好。“小鼠被疫苗完全保护,没有显示出生病的迹象。”(后来,沃尔斯发现,她可以将疫苗的剂量减少至1/9,再补上一针增强剂,同样能获得好的结果。)2021年1月,该疫苗在美国华盛顿州以及韩国进行了早期临床试验。

然而,当试验正在进行时,新冠病毒已经演化出一些新的变异株,它们能够逃避由第一代疫苗触发产生的一些抗体。所以沃尔斯继续着手设计一种改良版的全新纳米颗粒。该版本的疫苗并不是只使用新冠病毒RBD的拷贝,而是镶嵌了4类不同的RBD:一些来自新冠病毒,一些来自SARS病毒,一些则来自另外两种冠状病毒。在测试中,这种广谱的RBD针对所有的新冠病毒都能引起强大的抗体反应,包括最难以捉摸的变异株。

一种剂量小且有效,易于生产且成本低廉,不需要冷藏且能够抵御一系列突变病毒的疫苗,可能正是世界所需要的解决方案。这类研究已经引起了全球疫苗巨头的关注,包括葛兰素史克的拉波利。“毫无疑问,我们的免疫系统喜欢纳米颗粒。”他说,“这是我们的最佳选择。”在最近发表在《细胞》杂志上的一篇评论中,他预测这种人工设计的分子将开启疫苗新时代:“从此,一切皆有可能。”

这类蛋白质的能力不仅只局限于疫苗设计。我们正处于全新的氨基酸时代,而拥有了在原子尺度上智能设计纳米机器的能力,可以让我们把应对每一种疾病的过程变成一次工程实践。

(Scientific American中文版《环球科学》授权南方周末发表,黄凡翻译。本文有删节。)

罗恩·雅各布森 (Rowan Jacobsen)

继续阅读