近日,诺贝尔化学家、复旦大学多尺度复杂系统研究所名誉院长迈克尔·莱维特走进复旦光华大厦,给本科生上了两堂课。这门选修课名为"定量生物物理学前沿导论",由五位教授授课,包括莱维特和马建鹏。定量生物物理学又称计算生物学,是高度跨学科、生物、物理、化学、数学、药学、计算机科学等专业的年轻人可以学习的,成为前沿的跨学科储备人才。
解放日报、上关新闻记者发现,选修这门课程的本科生来自多个理工科专业,很多研究生也来听这门课程。"AlphaFold对蛋白质结构的精确预测导致了计算生物学从辅助学科向主导学科的演变,其科学和应用价值是显着的。莱维特的话在复旦学生的心目中播下了前沿基础研究的种子。

蛋白质结构预测取得突破
莱维特是世界顶尖科学家协会的副主席,2013年,他与另外两位计算生物学先驱分享了诺贝尔化学奖,因为他们"为复杂的化学系统创建了多尺度模型"。当年的奖项标志着科学界对使用计算机软件进行生物化学研究的高度认可,2020年Alpha Folding 2的发布标志着计算生物学在蛋白质结构预测和药物开发领域的实用价值。
这位诺贝尔奖获得者告诉他的同学,蛋白质是由氨基酸折叠而成的,而氨基酸链自发折叠成蛋白质的三维结构是分子生物学的"皇冠上的宝石"。科学家确定氨基酸序列相对容易,但很难分析蛋白质结构,这取决于数千个氨基酸原子的相互作用力。我们能开发出功能强大的计算机软件来准确预测蛋白质结构吗?莱维特已经研究这个问题55年了。
随着深度学习等人工智能技术的成熟,蛋白质结构预测问题迎来了突破。11月,由谷歌DeepMind开发的Alpha Fold 2赢得了国际蛋白质结构预测竞赛,预测精度非常接近实验测量。这一事件在科学界引起轰动,超越《阿尔法围棋》击败柯杰和李世石,被美国《科学》杂志评为"2020年十大科学突破"之一。
"Alpha Fold 2"预测(蓝色)和实验测定(绿色)蛋白质结构几乎相同。来源:DeepMind
"我没想到我会在有生之年看到这种突破!"莱维特叹了口气。在他看来,公司庞大的研发团队,强大的计算机资源的支持和之前研究成果的积累,是谷歌和深度思考成功的原因。
与大学生分享科研"命运"
你如何建立一个庞大的计算生物学团队?人才发展是第一要务。复旦大学多尺度复杂系统研究所所长马建鹏表示,为了培养年轻人才,该研究所在本学期开设了"定量生物物理学前沿导论"课程。除了莱维特和他之外,来自数学科学学院、化学系、生物医学学院和生命科学学院的三位教授也将任教,让本科生领略到前沿的跨学科魅力。
作为最大的品牌教授,莱维特的讲课内容是宏观的,非常意识形态化的。除了计算生物学和蛋白质折叠的历史,他还分享了自己的人生经历,如获得诺贝尔奖的成功以及培养诺贝尔奖级人才的环境条件。在回答一个学生关于"如何找到自己对科学研究的兴趣"的问题时,他说了一个词,偶然性,可以翻译为"命运"。他用自己的人生经历,解释了什么是科研之路的"命运"。
1960年代,莱维特在看了诺贝尔奖得主约翰·肯德鲁(John Kendru)的电视节目《生命线:分子生物学导论》(The Lifeline: Introduction to Molecular Biology)后,写信给在剑桥大学工作的肯德鲁(Kendru),希望成为他的博士生。然而,Kendru回信说,博士生人数已经满员。莱维特的一位朋友在得知此事后告诉他:"在商业上,当有人对你说'不'时,你会给他另一个选择说'是'。所以他写信给肯德鲁,"如果你明年不能成为你的博士生,你会吗?"看到这个年轻人如此执着,肯德鲁邀请他去剑桥面试,并推荐他在魏茨曼科学研究所学习计算生物学。46年后,莱维特在研究所遇到了他的诺贝尔奖获得者阿里尔·瓦舍尔(Ariel Vasher)。"这就是奇特。你应该对自己的事业充满热情,坚持不懈,创新和善良。"
诺贝尔奖获得者生动而富有哲理的讲座,让学生收获饱满。"例如,这节课令人大开眼界,要意识到分子生物学的核心定律可以从学习的角度来理解。生物学专业的肖扬帆告诉记者,"迈克尔的讲课方法也很有特色,每隔一刻钟,我们就会绕着刚才听到的东西两三分钟,这对提高学习效率很有帮助。"
如何加速计算生物学的发展
据了解,莱维特今年3月来到上海,主要工作是指导复旦团队研究计算生物学。目前,复旦大学多尺度复杂系统研究所开发的OPUS-Fold软件在蛋白质侧链结构的预测精度上超过了Alpha Folding 2,该论文将发表在英国生物信息学杂志上。马建鹏介绍,蛋白质靶向的药物分子大多与侧链相互作用,只有获得高精度的侧链结构才能设计出药物分子,因此这一突破对新药的开发具有重要意义。
复旦团队根据已知的主链对侧链进行了建模:蓝色作为目标结构,红色作为预测结构。
不过,从整个系统来看,"Alpha Fold 2"依然是世界领先者。DeepMind首席执行官Demis Hassabis最近宣布,该公司正在与欧洲生物信息学研究所合作,建立一个蛋白质结构数据库,为超过350,000种蛋白质结构提供数据访问。DeepMind计划将数据库扩展到超过1亿种蛋白质,涵盖几乎所有人类已知的蛋白质。
Alpha Fold 2将计算生物学置于快速通道上,许多研究团队正在开发此类软件。七月份,华盛顿大学的研究小组在《科学》杂志上发表了一篇关于开源软件RoseTTAFold的论文,该软件不仅预测了蛋白质结构,还预测了多种蛋白质的结合形式。八月份,斯坦福大学团队在《科学》杂志上发表了一篇封面论文,提出了人工智能算法预测RNA(核糖核酸)三维结构的突破。
许多科学家认为,蛋白质结构的准确预测是一场技术革命,将导致生物医学、新材料等方面的产业变革。"从预测蛋白质结构,寻找药物靶点到药物分子设计,再到临床试验设计,人工智能正在全面进入制药行业并发挥关键作用,"上海交通大学Med-X研究所副院长尹威海说。"科学家还可以利用人工智能软件开发新材料,如自然界中不存在的蛋白质材料,用于化工、能源、环保等行业。
在莱维特看来,中国可以有更多的研究型大学为本科生提供计算生物学课程,激发他们的兴趣,并吸引他们在未来进入这一科学和技术前沿。他还建议上海加快计算生物学的发展,为科研团队提供更强大的计算资源,扩大科研团队的规模,让"工作折叠"等具有自主知识产权的软件加速迭代。
专栏编辑:黄海华 文字编辑:严陶然
来源:作者:陶然