天天看点

全球“AI蛋白质第一人”许锦波归国加入国家级生命科学实验室

3月23日,由前沿科技媒体机器之心主办的“AI科技年会”上,美国芝加哥丰田计算技术研究所教授许锦波在演讲中宣布归国加入国家级实验室,并分享了AI预测蛋白质结构和功能这一新兴领域的发展沿革与最新进展。

许锦波被业界誉为“AI预测蛋白质结构全球第一人”,早在2016年,他开发的RaptorX-Contact方法,首次证明了深度学习方法预测蛋白质结构的可行性,拉开了AI蛋白质结构预测时代的序幕。谷歌DeepMind开发的AlphaFold软件也是基于许锦波团队前期研究成果。

全球“AI蛋白质第一人”许锦波归国加入国家级生命科学实验室

许锦波表示,准确描述蛋白质的结构和功能,是理解生命过程的基础。蛋白质的结构和功能联系紧密,预测蛋白质的结构有助于人们在原子层面了解蛋白质的功能。近年来,随着人工智能的又一次兴起,蛋白质的结构预测从传统的物理和统计方法,快速走向最新的机器学习乃至深度学习算法。深度学习技术颠覆了蛋白质结构预测,可以正确预测90%的蛋白质形状,其中50-60%的蛋白质可以做到高分辨率预测,在此基础上,推动分子生物学界的研究范式从基于序列的研究到基于结构的研究,进而促进了基于结构的药物发现和设计,提高了蛋白质从头设计的效率。

众所周知,细胞是构成生命体的基本单位,而蛋白质则是构成细胞的重要生命物质,是生命活动的体现者和承担者。这其中,蛋白质分子的组成及其折叠结构,在很大程度上决定了蛋白质所具备并正在发挥的生物学功能。然而,如何清晰“理解”蛋白质的折叠结构,是困扰生物学界的一个“世纪难题”。一旦解开,人类对于生命的理解将迈出飞跃性的一步。

全球“AI蛋白质第一人”许锦波归国加入国家级生命科学实验室

以当下火热的生物医疗产业为例,利用细胞、组织、体液等制造的一系列生物医疗制品,如单克隆抗体、重组蛋白、疫苗及基因和细胞治疗药物等大分子药物,因功效普遍较化学药更高且毒副作用小,近年来得到医疗产业界越来越多的关注,市场规模增长率远高于化学药。通过AI对蛋白质结构和功能进行预测,可以帮助人们深入了解包括癌症、遗传病等诸多顽疾的发病机理,进而找到治疗更精准的路径;同时,借助AI进行蛋白质结构优化,还可以极大地提升大分子药物的研发效率、降低成本。

而除了医疗产业以外,由于蛋白质可用作为诸如酶和激素之类的生物催化剂,在食品、化工、能源、环境工程等诸多领域有有着广泛的应用,可想而知,用AI破解蛋白质结构之谜、并在此基础上进行结构设计和优化,可以给未来社会发展带来怎样天翻地覆的变化。

过去的近六年时间里,许锦波在AI蛋白质结构预测领域做出了开创性的贡献。

2016年,许锦波开发出基于残差网络(ResNet)的RaptorX-Contact方法,其采用全局式的结构预测方式,将图像处理中的图像分割技术迁移到蛋白质结构预测领域,采用深度学习卷积网络对蛋白质结构进行整体测算,并通过距离矩阵重构蛋白质分子三维结构,从而大幅度提高了蛋白质结构预测。同年,在被称为“蛋白质结构预测领域的奥林匹克竞赛”——第十二届国际蛋白质结构预测竞赛(CASP,Critical Assessment of protein Structure Prediction)中,RaptorX-Contact在蛋白质接触矩阵的预测上得分居首位。这一蛋白质结构预测的核心思想得到了谷歌DeepMind团队的重视,并应用在AlphaFold的开发中。

全球“AI蛋白质第一人”许锦波归国加入国家级生命科学实验室

除了开辟AI蛋白质预测的新思路之外,许锦波团队还研发了多个著名的生物信息学软件,包括蛋白质相互作用网络分析软件IsoRank。去年以来,许锦波团队继续通过使用残差网络(ResNet),在不使用协同进化(co-evolution)信息的条件下,实现了较高的蛋白质结构预测水平,并在预测人工设计的蛋白质结构时表现得更为出色。这一研发成果对蛋白质工程和蛋白质设计都具有重要意义。

许锦波教授将加入聚焦生命科学领域、代表国家战略科技力量的北京昌平实验室,并将在此继续围绕蛋白质预测与设计开展科研攻关。

继续阅读