天天看點

深度學習與化學語言模型結合,用于藥物從頭設計,登Nature子刊

作者:ScienceAI
深度學習與化學語言模型結合,用于藥物從頭設計,登Nature子刊

編輯 | X

從頭藥物設計旨在從零開始生成具有特定化學和藥理學特性的分子。

近日,蘇黎世聯邦理工學院的化學家開發了一種新的計算機程式,可以根據蛋白質的三維表面快速、輕松地生成活性藥物成分。

研究人員提出了一種利用基于互相作用組(interactome)的深度學習的計算方法,用于基于配體和結構的類藥物分子生成。

「這是藥物發現的真正突破。」蘇黎世聯邦理工學院化學與應用生物科學系教授 Gisbert Schneider 說。

這種方法利用了圖神經網絡和化學語言模型的獨特優勢,為特定應用的強化、遷移或少樣本學習的需求提供了替代方案。

相關研究以《Prospective de novo drug design with deep interactome learning》為題,于 4 月 22 日 釋出在《Nature Communications》上。

深度學習與化學語言模型結合,用于藥物從頭設計,登Nature子刊

論文連結:https://www.nature.com/articles/s41467-024-47613-w

計算從頭設計包括從頭開始自主生成具有所需特性的新分子。化學語言模型 (CLM) 是一種機器學習技術,旨在處理和學習表示為序列的分子結構(例如,SMILES)。CLM 已經在新的生物活性分子的重新設計中發現了許多應用。

盡管已經引入了各種基于結構的從頭設計方法,但它們的潛在應用尚未得到廣泛探索。

最近的科學家集中在研究分子互相作用網絡,稱為互相作用組,它涵蓋各種類型的互相作用,例如蛋白質-蛋白質、藥物-靶标互相作用和藥物-藥物關系。分析這些互相作用組可以預測以前未知的互相作用,并給出對網絡拓撲的深入了解。

深度學習和化學語言模型結合

為了全面研究藥物-靶标互相作用組,蘇黎世聯邦理工學院研究人員提出了一種将 CLM 與基于互相作用組的深度學習相結合的方法。此深度學習模型被命名為 DRAGONFLY(基于藥物靶标互相作用的新型生物活性分子的生成)。

對于任何具有已知三維形狀的蛋白質,該算法會生成增加或抑制蛋白質活性的潛在藥物分子的藍圖。然後化學家可以在實驗室合成和測試這些分子。

該算法所需要的隻是蛋白質的三維表面結構。在此基礎上,它根據「鎖與鑰匙」原理設計出與蛋白質特異性結合的分子,這樣它們就可以與蛋白質互相作用。

該方法采用了由圖變換神經網絡(GTNN)和利用長短期記憶(LSTM)的 CLM 組成的神經網絡架構。

深度學習與化學語言模型結合,用于藥物從頭設計,登Nature子刊

圖示:DRAGONFLY 架構和工作流程。(來源:論文)

DRAGONFLY 方法采用圖神經網絡架構。該方法利用 GTNN 模型對輸入分子圖進行編碼,該分子圖表示為配體的 2D 圖和蛋白質結合位點的 3D 圖。GTNN 将圖轉換為壓縮的一維 (1D) 特征向量。随後,使用基于 RNN-LSTM 架構的 CLM 進行分子生成過程,将該特征向量解碼回相應的分子字元串。

與依賴于單個分子遷移學習的傳統 CLM 不同,該方法利用基于互相作用組的深度學習,能夠跨多個節點整合來自靶标和配體的資訊。DRAGONFLY 能夠處理小分子配體模闆以及 3D 蛋白質結合位點資訊。它在不同的化學字母表上運作,不需要通過針對特定應用的遷移或強化學習進行微調。

此外,它能夠将所需的實體和化學特性納入輸出分子的生成中。該研究介紹了 DRAGONFLY 在基于結構的從頭設計中的前瞻性應用,特别是針對一個或多個特定大分子靶标生成具有所需生物活性特征的配體。

從頭藥物設計

DRAGONFLY 解決了生成分子設計方法中常見的一些挑戰。事實證明,該方法:

  • 與針對藥物樣配體模闆的分别微調的基于 RNN 的 CLM 相比,實作了相似甚至更好的結果。
  • 使用 3D 蛋白質結合位點實作基于結構的設計。
  • 有效地将所需的實體和化學性質納入生成的分子中。它能夠結合基于結構和基于配體的方法,以及整合所需特性的能力,使其成為藥物化學的潛在有用工具。

DRAGONFLY 能夠「零樣本」建構具有特定生物活性、可合成性和結構新穎性的化合物庫。

深度學習與化學語言模型結合,用于藥物從頭設計,登Nature子刊

圖示:使用 DRAGONFLY 和定量構效關系(QSAR)模型進行屬性轉換。(來源:論文)

為了主動評估基于蛋白質結構的藥物設計的深度互相作用組學習架構,産生了針對人類過氧化物酶體增殖物激活受體(PPAR)γ 亞型結合位點的潛在新配體。

深度學習與化學語言模型結合,用于藥物從頭設計,登Nature子刊

圖示:使用 DRAGONFLY 進行基于結構的從頭設計的結果。(來源:論文)

一流的設計是化學合成的,并經過計算、生物實體和生物化學表征。鑒定出有效的 PPAR 部分激動劑,證明其對核受體和脫靶互相作用具有良好的活性和所需的選擇性。

深度學習與化學語言模型結合,用于藥物從頭設計,登Nature子刊

圖示:蛋白質-配體共結晶。(來源:論文)

配體-受體複合物的晶體結構測定證明了預期的結合模式。

這一成功成果積極倡導基于互相作用組的從頭設計在生物有機和藥物化學中的應用,進而能夠建立創新的生物活性分子。

基于互相作用組的深度學習可作為「零樣本」學習的概念驗證,可以針對小分子藥物發現中的特定應用進一步調整和定制,最終實作在生物有機化學和藥物化學中更有效的命中和先導發現。

通過利用資料驅動的深度學習和互動網絡,這種方法為基礎模型提供了新的途徑,進而實作定制的分子設計政策和創新候選藥物的發現。

「新算法潛力巨大。我們的研究使藥物研究中的生成式 AI 可以進入蛋白質世界。」Schneider 說。對于人體内所有不與任何已知化合物互相作用的醫學相關蛋白質來說尤其如此。

繼續閱讀