天天看點

中國科學家利用計算生物學開展新冠病毒系列研究,揭示病毒侵染機理

近年來,微軟亞洲研究院在新冠病毒方面進行了一系列研究。

2021 年,微軟亞洲研究院與清華大學在Advanced Theory and Simulations上共同發表了封面文章《通過分子動力學模拟探索 SARS-CoV-2 刺突蛋白 NTD 的調控功能》(Exploring the Regulatory Function of the N-terminal Domain of SARS-CoV-2 Spike Protein Through Molecular Dynamics Simulation)[1]。

這是微軟亞洲研究院和清華大學生命科學學院龔海鵬教授團隊共同開展的一項計算生物學研究,主要通過分子動力學模拟、研究新冠病毒侵染人類機理中 N 端結構域 NTD(N-Terminal Domain)的作用。

起感染調控作用的 NTD

據了解,在新冠病毒表面有一層 S 蛋白,隻有在被人體的受體蛋白 ACE 2 識别以後,病毒才能進入人體。兩者結合能力越強,就越容易造成感染。

S 蛋白的形态有點像字母“Y”,向下的一豎即 S2 區域嵌入在病毒表面,起到固定的作用。伸出來的兩個“枝丫”分别叫作 NTD 和 RBD(受體結合域,Receptor Binding Domain)。

中國科學家利用計算生物學開展新冠病毒系列研究,揭示病毒侵染機理

圖 | 新冠病毒 S 蛋白結構(左圖為 S 蛋白三聚體結構,由三條鍊組成;右圖為 S 蛋白單體結構,由 NTD、RBD 以及 S2 組成)(來源:微軟亞洲研究院)

在該研究之前,人們已經通過實驗知道了 RBD 可以直接起到一個識别人體受體蛋白的作用,而 NTD 的具體作用還不十厘清晰。

微軟亞洲研究院和龔海鵬教授實驗室合作搭建了一個有百萬個原子的穩定模拟體系,在進行了數十億步(1 步是 1 飛秒,即一千萬億分之一秒)的分子動力學模拟之後,提出了一個“楔形”模型假說,簡單來說,可以把 NTD 看作是安插在了 RBD 和“Y”字底部的一個“楔子”。

研究發現,RBD 有 down 和 up 兩種狀态,隻有 up 狀态才有可能與人的受體蛋白做識别。該項研究發現,RBD 傾向于從 up 的狀态轉變為 down 的狀态,而當 NTD 像楔子一樣塞入 RBD 下端時,阻止了 RBD 的這一傾向,即 NTD 使得 RBD 保持 up 狀态,進一步讓其擁有了感染的能力。

可以說,NTD 在病毒的侵染過程中起到了一個調控作用,調節 RBD 的形态,進而改變了病毒感染人體的傾向。

中國科學家利用計算生物學開展新冠病毒系列研究,揭示病毒侵染機理

圖 | NTD 在 SARS-CoV-2 的 S 蛋白構象變化中發揮調控功能示意圖(來源:微軟亞洲研究院)

由此可以預見,NTD 調控 RBD 的界面可能成為潛在的藥物靶點。若能設計一個藥物分子可以把 NTD 向外拉出,也就是把這個“楔子”拔出來,那 RBD 就傾向于 down 的狀态,變成沒有感染能力的構象,病毒感染人的能力就會減小很多。

“我們這項工作在世界範圍内首次提出了 NTD 在病毒侵染過程中的調控模型。此外,我們根據這個潛在的藥物靶點,設計了藥物的虛拟篩選算法,并對新冠病毒的一些潛在性藥物做了一定篩選,為新冠病毒藥物研發提供了一定的參考價值。”微軟亞洲研究院主管研究員王童說道。

新模型揭秘奧密克戎強感染性的原因

近期,微軟亞洲研究院和清華大學生命科學學院王新泉教授以及該校醫學院張林琦教授課題組開展合作,在奧密克戎變異株強傳染性的機了解釋方面有了新的突破,其論文已被生物學領域的頂級期刊Cell Research接收。

據了解,在此次合作中,王新泉教授課題組率先解析了奧密克戎高分辨率的晶體結構,為奧密克戎感染機理研究奠定了基礎。

相比于靜态的晶體結構,王童團隊利用分子動力學模拟從“動态視角”模拟和分析奧密克戎結構變異及其侵染機理。

研究中,微軟亞洲研究院的研究員們首先建構了兩個模拟體系,分别以原始的新冠病毒結構和奧密克戎的結構作為起始結構,對這兩個結構平行地進行長時間、數億步的分子動力學模拟,模拟出的是原子級别的運動過程,進而觀察病毒在人體中的真實變化。

中國科學家利用計算生物學開展新冠病毒系列研究,揭示病毒侵染機理

(來源:Pixabay)

“對分子運動進行模拟的方法可以分成兩種,經典的分子動力學模拟和基于第一性的量子模拟,”王童說,“對于研究新冠病毒中蛋白大分子、大尺度的構象變化運動,經典動力學模拟方法是一種更适合的手段。”

據王童介紹,經典模拟适用于大體系,像蛋白質成千上萬的原子,比如此次模拟體系就包含上百萬的原子。從時間上來說,經典模拟做的都是數億到數十億步的模拟。相比之下,量子模拟相對準确,但計算過程的耗時使其隻能适用于非常小的體系,比如對隻有十餘個原子的體系計算性質或進行短暫的模拟。

建構了模拟體系之後,微軟亞洲研究院利用自研算法,分析了原始新冠病毒和奧密克戎感染人體的能力,以及它們結構上非常細微的差異。

值得注意的是,研究過程中産生的資料量極其龐大,整個模拟下來,至少有數億個結構,産生了數億到數十億幀的結構變化。

為此,研究人員創造性地提出一種全新的馬爾科夫模型算法對資料進行分析。其對分子動力學模拟的資料分析有着更強的表征能力,可以更加真實地模拟出蛋白的動态變化過程。

在對海量的資料進行篩選和分析後,研究人員将數十億的結構聚合成幾類代表性的結構,再去分析它們之間的差別和如何互相轉換,以及與人受體蛋白的結合能力,進而更好地了解奧密克戎感染的分子機理。

這些聚合出來的代表性構象被稱為“亞狀态”,研究人員對其做了定性的結合自由能計算,以此在一定程度上反映病毒的感染能力。

具體來說,在研究中,聚類以後的奧密克戎和原始病毒都有三個亞狀态。由于奧密克戎本身隻是原始病毒的變體,是以它們各自占比最高的一個亞态,無論是從結構上,還是和人的受體蛋白結合的能力上來說都是非常類似的。

由此可見,奧密克戎結構的關鍵不同之處在其他兩個亞狀态上。相比原始病毒的兩個亞狀态,奧密克戎的兩個亞狀态和人的受體蛋白 ACE2 有更多的互相作用,結合能力更強(結合自由能更低),是以可能導緻了更強的感染能力。

同時研究還發現,奧密克戎的三個亞狀态之間互相轉換非常快,很容易從類似于原始病毒的主亞狀态,轉換成結合能力更強的另外兩個亞狀态。這也從動态視角解釋了為什麼奧密克戎感染性這麼強的一個原因。

中國科學家利用計算生物學開展新冠病毒系列研究,揭示病毒侵染機理

圖 | 分子動力學模拟揭示奧密克戎的狀态變化及感染機理(左圖為新冠病毒 S 蛋白,右圖為奧密克戎變異株的 S 蛋白,其中兩個體系的 State3 基本一緻且為主要構象,奧密克戎的另外兩個亞态結合自由能明顯高于新冠病毒的兩個亞态)(來源:微軟亞洲研究院)

在最新有關奧密克戎的研究工作中,王童表示,“這項研究在世界上首次使用‘幹濕結合’的方式和動态視角,從結構生物學和計算生物學兩個角度同時出發,提出了奧密克戎感染性強的分子機理。”

“幹濕結合”促進科學研究

上面提到的“幹濕結合”,也就是“幹實驗”(計算實驗)和“濕實驗”(傳統科學實驗)的結合。

據了解,“幹實驗”可以對“濕實驗”現有的一些結論做驗證和補充,還能做一些“濕實驗”做不了的或者是需要花很多時間、人力去做的研究。

比如,在奧密克戎的研究中,若在“濕實驗”實驗室裡一個個去分析突變位點結構的變化,可能需要數月時間,在疫情如此嚴峻的情況下,顯然不利于疫情防控工作。而使用計算的手段來模拟這種突變造成的影響,可能隻需要一周到兩周的時間。

另外,“濕實驗”在前期很多時候都是探索性質的,甚至在研究方向上是非常迷茫的。這時“幹實驗”可以在一定程度上引導“濕實驗”的實驗設計,幫助其找到一個更容易成功的方法。

值得注意的是,兩者并不是互相取代,而是同等重要、互相指導、相輔相成的。“我們在和研究夥伴合作的過程中就有這樣的感覺,我們認為‘幹濕結合’會對整個科學研究起到一個螺旋式上升、波浪式前進的推動作用。”王童說道。

中國科學家利用計算生物學開展新冠病毒系列研究,揭示病毒侵染機理

圖 | 微軟亞洲研究院主管研究員王童(來源:王童)

他還補充說,在新冠病毒的研究方面,與清華大學多位老師的合作是一個非常好的起點。微軟亞洲研究院非常希望能和海内外高校、科研院所的專家學者們有更多的深入合作和跨領域交流。

據了解,微軟亞洲研究院後續還會就新冠病毒為何在整個冠狀病毒進化過程中感染性如此強的原因方面開展相關研究。

跨學科發展對人才提出了更高要求

最後,關于計算生物學等跨學科領域對人才的要求和發展趨勢,王童也發表了自己的看法。

他認為跨學科發展主要是圍繞一個關鍵詞,就是“交叉”。交叉不是簡單的“加法”,而是“乘法”。兩個學科之間要發生一定的化學反應和深度的融合。

拿計算生物學來說,其本質上就是計算機科學與生物學的交叉,需要結合兩個領域的知識,并真正消化了解,才能在計算生物學領域産生真正的學術影響力,解決真正的科學問題。

而這也對人才的培養或者說對人才的需求,提出了一個更高的要求。如果研究人員隻掌握某一方面的知識,對另一學科的認識不夠深入,隻停留在簡單的工具使用層面,那麼研究工作就隻能浮于表面,也很容易造成計算參數設定有誤等問題,導緻最終計算結果與實驗結果完全不一樣的情況。

未來,各學科之間的交叉融合一定會越來越多,在具體的科研工作中,不同背景的人才在合作交流過程中,需要更多傾聽對方領域的知識和訴求,隻有建立在互信、開放心态的基礎上,才能推動跨學科間的研究持續向前發展。

-End-

中國科學家利用計算生物學開展新冠病毒系列研究,揭示病毒侵染機理

參考:

1、Y. Li,T. Wang,J. Zhang,B. Shao,H. Gong,Y. Wang,X. He,S. Liu,T. Liu.Exploring the Regulatory Function of the N-terminal Domain of SARS-CoV-2 Spike Protein through Molecular Dynamics Simulation.Advanced Theory and Simulations4(2021).

https://doi.org/10.1002/adts.202100152

繼續閱讀