天天看點

北大科研團隊聯合開發機器學習計算方法,預測蛋白質金屬結合位點

作者:我是科學家iScientist

近日,北京大學王初與蘇曉東課題組合作在Nature Chemical Biology上發表文章,基于機器學習和蛋白質“共進化”信号,分析預測蛋白質中的金屬結合位點,開發了“2D”機器學習計算方法“MetalNet”,為研究金屬蛋白質組和金屬生物學提供了新的研究工具。

北大科研團隊聯合開發機器學習計算方法,預測蛋白質金屬結合位點

論文截圖 | 參考文獻[1]

以下是文章作者為果殼撰寫的研究解讀。

什麼是金屬結合蛋白

蛋白質是承擔重要功能的生物大分子,而金屬離子由于其獨特的實體化學性質,在蛋白質中發揮着穩定結構、催化反應、運輸物質、傳導信号等功能。據估計,人體内兩萬多種蛋白質中有四分之一甚至三分之一都會與金屬離子發生結合,是以,對蛋白質具體金屬結合位點的預測,有助于進一步深入研究和了解蛋白質的功能。

北大科研團隊聯合開發機器學習計算方法,預測蛋白質金屬結合位點

金屬蛋白的功能(來自維基百科https://en.wikipedia.org/wiki/Metalloprotein)

目前已有多種實驗方法直接探索蛋白質組中的金屬結合蛋白,也出現了依賴蛋白質的1D氨基酸序列或者3D結構的計算方法,但從蛋白質組還未發現序列或結構同源性的蛋白中發現新型金屬結合蛋白,預測其結合位點仍具有挑戰。

在這個研究中,該團隊探究了“共進化”信号在蛋白質金屬結合位點的分布情況,結合共進化信号和機器學習政策,開發了“2D”機器學習方法“MetalNet”,預測蛋白質組中金屬結合蛋白以及金屬結合位點。

什麼是共進化

北大科研團隊聯合開發機器學習計算方法,預測蛋白質金屬結合位點

多序列比對與共進化信号 | 團隊供圖

近年來,已有研究從多序列比對(multiple sequence alignment,MSA)中計算得到蛋白質殘基之間的共進化信号,并結合機器學習對蛋白質結構及蛋白質-蛋白質互相作用做出預測。多序列比對是蛋白質研究中的常用方法。傳統的生物資訊方法主要關注在不同序列之間不易變化的保守資訊,而有一類氨基酸對會在不同序列間頻繁變化,但兩兩之間存在協同的特征。處于同一序列的某一對氨基酸,可能在折疊形成的三維結構中距離較近而發生互相作用,維持蛋白質的穩定性,因而兩者其中一個殘基發生突變,另一個相應發生突變,這被稱為“共進化”(coevolution)。受此前工作啟發,該團隊想探究共進化能否在蛋白質功能位點預測中發揮作用。

簡單介紹MetalNet

該團隊挑選了具有“共進化”信号的氨基酸對,并統計它們在MSA中的頻率矩陣,結果發現金屬結合位點的 “圖案”與非金屬結合位點存在明顯的差別。于是研究人員訓練了一個簡單機器學習模型,基于兩者的差異對這些“圖案”進行二分類,并預測這些氨基酸對是否可以結合金屬離子。

北大科研團隊聯合開發機器學習計算方法,預測蛋白質金屬結合位點

MetalNet流程圖 | 團隊供圖

在對目标蛋白進行預測之後,可以得到一個“圖”,每個氨基酸對可以視為“圖”中的“邊”。經過進一步統計分析,可以在圖上定位出具有高置信度的“團簇”作為預測結果,即潛在的金屬結合口袋。同時,這些團簇還可以和已知的金屬結合口袋進行比較,給出可能結合的金屬類别。

該團隊通過一系列的資料挖掘和分析,展現出MetalNet非常可信的預測結果,并且在提高MSA的品質的情況下,可以進一步優化預測結果。本方法不依賴蛋白質結構,僅輸入多序列比對衍生的共進化資訊,但最終表現略好于傳統基于結構的方法,同時由于具有較高的準确度,非常适合用來進行蛋白位點功能注釋及指導蛋白質功能研究實驗等。

發現新的金屬結合蛋白

MetalNet在測試中也表現優異,預測的結構符合實驗得到的結果。将其應用于預測Pfam蛋白質家族資料庫中缺少結構的蛋白質時,在1116個家族代表性蛋白中預測到175個具有共進化殘基網絡簇的蛋白。該團隊在生化和結構水準上驗證了幾個未被注釋的金屬結合蛋白,并解析了來自大腸杆菌的蛋白citX的晶體結構,預測得到一個由三個半胱氨酸(C145、C148 和 C155)和一個組氨酸H161組成的共進化網絡,該網絡的拓撲結構與實驗得到的鋅結合位點非常吻合。

北大科研團隊聯合開發機器學習計算方法,預測蛋白質金屬結合位點

CITX金屬結合位點的實驗驗證 | 團隊供圖

由于蛋白質結構預測在這兩年取得了飛速進展,DeepMind已經釋出幾乎所有已知蛋白的預測結構,隻依賴序列資訊方法可能已經不具優勢。該團隊希望在未來可以利用如神經網絡等架構,将結構資訊也引入機器學習流程,同時努力把MetalNet開發方法應用于更多蛋白結合位點,解決不同金屬類别的預測問題。

參考文獻

[1]Cheng, Y., Wang, H., Xu, H. et al. Co-evolution-based prediction of metal-binding sites in proteomes by machine learning. Nat Chem Biol (2023). https://doi.org/10.1038/s41589-022-01223-z

作者:劉源 程瑤

編輯:靳小明

排版:尹甯流

題圖來源:團隊提供

北京大學化學與分子工程學院2017級博士研究所學生程瑤、2018屆博士畢業生王浩博、北京大學生命科學學院2022屆博士畢業生徐華和王初課題組的劉源副研究員為本文的共同第一作者。王初課題組的馬斌、陳學敏、曾欣和王相賀等合作者為本課題做出了貢獻。該工作得到了國家自然科學基金委和北京分子科學國家研究中心的經費支援。

論文資訊

釋出期刊Nature Chemical Biology

釋出時間 2023年1月2日

論文标題 Co-evolution-based prediction of metal-binding sites in proteomes by machine learning

(DOI:https://doi.org/10.1038/s41589-022-01223-z)

未來光錐是果殼發起的科創品牌,全面服務科學家的科技創新,為科學家創業提供從公司注冊知識産權,到融資需求、團隊組建等不同階段的方案建議,加速科技成果從實驗室到市場的轉化。

果殼團隊有着長達13年為科學家服務的經驗,我們始終站在科學家的視角出謀劃策,做科創者的好朋友。如果您正打算創辦一家科技企業,無論是找錢、找人、找資源,還是找訂單,都歡迎與未來光錐團隊聊聊。您可發送bp或其他項目資料到[email protected],留下聯系方式,或添加果殼硬科技企業微信私信溝通。

繼續閱讀