天天看點

夢想成真:AI預測蛋白質結構

夢想成真:AI預測蛋白質結構

ai現在可以快速可靠地預測大多數蛋白質的三維形狀。圖檔來源:deepmind

近日,美國華盛頓大學和英國deepmind公司分别公布了多年工作的成果:先進的模組化程式,可以預測蛋白質和一些分子複合物的精确三維原子結構。其中一個研究小組報告說,他們已經使用最新開發的人工智能(ai)程式預測了來自人類和20種模式生物的35萬種蛋白質結構——如大腸杆菌、酵母和果蠅。未來幾個月裡,他們計劃将所有已編目的蛋白質列入模型蛋白質名單,大約有1億個分子。

“這是相當驚人的。”美國馬裡蘭大學蛋白質專家john moult說,他每兩年舉辦一次名為“關鍵的蛋白質結構預測方法”(casp)的比賽。moult表示,幾十年來,結構生物學家一直夢想有一天,計算機模型能增加從x射線晶體學等實驗方法中獲得的極精确蛋白質形狀的數量。“我從沒想過這個夢想會成真。”moult說。

這一名為alphafold的模型是deepmind公司研究人員的成果,deepmind是一家隸屬于谷歌母公司alphabet的英國ai公司。2020年,alphafold“橫掃”了casp。但是deepmind研究人員沒有透露繪制蛋白質形狀的理論細節,特别是alphafold的底層計算機代碼。

這種情況已開始改變。7月15日,華盛頓大學的minkyung baek和david baker研究小組報告說,他們建立了一個名為rosettafold的高度精确的蛋白質結構預測程式,并公開釋出了該程式。相關成果線上發表于《科學》。與此同時,《自然》發表了一篇由deepmind研究人員demis hassabis和john jumper撰寫的論文,公布了alphafold的細節。

兩個程式都使用ai在龐大的蛋白質結構資料庫中識别折疊模式。這些程式通過考慮蛋白質中相鄰氨基酸互相作用的基本實體和生物學規則,計算出未知蛋白質最可能的結構。論文顯示,baek和baker使用rosettafold建立了一個包含數百個g蛋白偶聯受體(一類常見的藥物靶點)的結構資料庫。

而deepmind研究人員創造了35萬個預測結構,是以前實驗方法得到的結果的兩倍多。研究人員表示,alphafold産生了近44%的人類蛋白質結構,涵蓋了人類基因組編碼的近60%的氨基酸。alphafold确定許多其他人類蛋白質是“無序的”,這意味着它們的形狀不是單一結構。

此外,deepmind與歐洲分子生物學實驗室合作共建了一個新的蛋白質預測資料庫,可以在網上免費通路。“能提供這種服務真是太棒了。” baker說,“這真的會加快研究步伐。”因為蛋白質的3d結構在很大程度上決定了它的功能,是以這一資料庫便于生物學家厘清數千種未知蛋白質是如何工作的。(文樂樂)

來源: 《中國科學報》

繼續閱讀