天天看點

輝瑞 AI 方法登 Science,揭示數以萬計的配體-蛋白質互相作用

作者:ScienceAI
輝瑞 AI 方法登 Science,揭示數以萬計的配體-蛋白質互相作用

編輯 | X

盡管蛋白質結構預測取得了重大進展。但對于 80% 以上的蛋白質,迄今為止尚未發現小分子配體。識别大多數蛋白質的小分子配體仍具有挑戰性。

現在,奧地利科學院分子醫學研究中心 CeMM 的研究人員與輝瑞公司合作,開發了一種方法來預測數百種小分子與數千種人類蛋白質的結合活性。

這項大規模研究揭示了數以萬計的配體-蛋白質互相作用,通過探索這些互相作用,進而可以開發化學工具和治療方法。

此外,在機器學習和人工智能的支援下,它可以「公正」地預測小分子如何與活體人類細胞中存在的所有蛋白質互相作用。

相關研究以《Large-scale chemoproteomics expedites ligand discovery and predicts ligand behavior in cells》為題,于 4 月 26 日發表在《Science》雜志上。

輝瑞 AI 方法登 Science,揭示數以萬計的配體-蛋白質互相作用

論文連結:https://www.science.org/doi/10.1126/science.adk5864

大多數藥物都是影響蛋白質活性的小分子。如果充分了解這些小分子,它們也是表征蛋白質行為和進行基礎生物學研究的寶貴工具。

鑒于這些重要作用,令人驚訝的是,對于 80% 以上的蛋白質,迄今為止尚未發現小分子結合物。這阻礙了新藥和治療政策的開發,同樣也阻礙了對健康和疾病的新生物學見解。

輝瑞 AI 方法登 Science,揭示數以萬計的配體-蛋白質互相作用

圖示:配體發現方法的示意圖。(來源:論文)

為了縮小這一差距,CeMM 的研究人員與輝瑞公司合作擴大并擴充了一個實驗平台,使他們能夠預測數百種具有不同化學結構的小分子如何與活細胞中所有表達的蛋白質互相作用。

這産生了數以萬計的配體-蛋白質互相作用的豐富目錄,現在可以進一步優化這些目錄,來代表進一步治療開發的起點。

具體而言,研究人員使用化學蛋白質組學方法來繪制人類蛋白質組中蛋白質-配體互相作用的圖譜。通過附着在光活化交聯劑的約 400 個配體片段的文庫,作者鑒定了約 2500 個蛋白質中的約 50,000 個具有統計顯著性的互相作用,其中包括大部分之前沒有已知配體的靶标。

并通過生化實驗驗證了這些結果,從篩選中鑒定出 E3 連接配接酶粘合劑和跨膜轉運蛋白抑制劑。

內建機器學習二進制分類器進一步實作了細胞中片段行為的可解釋預測。由此産生的片段-蛋白質互相作用和預測模型的資源将有助于闡明分子識别原理,并加快迄今為止未藥物化的蛋白質的配體發現工作。

在該研究中,由 CeMM PI Georg Winter 上司的團隊通過開發細胞轉運蛋白的小分子結合物、細胞降解機制的成分,以及參與細胞信号轉導的未被充分研究的蛋白質來證明這一點。

輝瑞 AI 方法登 Science,揭示數以萬計的配體-蛋白質互相作用

圖示:片段混雜預測。(來源:論文)

此外,利用大資料集,開發了機器學習和人工智能模型,可以預測其他小分子如何與活人類細胞中表達的蛋白質互相作用。

研究人員利用完全功能化片段(Fully functionalized fragment,FFF)描述符,将其與一個快速、輕量級、全自動的 ML 算法相結合,用于二進制分類。

簡而言之,首先根據蛋白質互相作用計數的門檻值将篩選的片段标記為混雜(1)或非混雜(0)。然後,使用基于 Transformer 的 ML 模型(TabPFN)将化合物的 FFF 描述符映射到分類分數(0 或 1)。

TabPFN 是一個完全學習的模型,它近似于貝葉斯推理,不需要超參數調優,是以可以根據化學蛋白質組學分析資料直接獲得高性能的 ML 分類器。

通過這種方法,混雜模型還可以了解結合蛋白質的特異性。

「我們驚訝地發現 AI 和機器學習如何提高我們對人類細胞中小分子行為的了解。我們希望我們的小分子-蛋白質互相作用目錄和相關的 AI 模型現在可以為藥物發現方法提供一條捷徑。」Winter 說。

為了最大限度地發揮科學界的潛在影響和實用性,所有資料和模型都通過網絡應用程式免費提供(開源位址:https://ligand-discovery.ai)。

輝瑞公司副總裁兼藥物設計主管 Patrick Verhoest 博士說。「這是工業界和學術界的傑出合作。我們很高興向大家展示,我們團隊三年密切合作所取得的成果。這是一個偉大的項目。」

參考内容:https://phys.org/news/2024-04-shortcut-drug-discovery-method-large.html

繼續閱讀