天天看點

JMC | 人工智能在藥物發現中的應用:走進廣闊的天地

JMC推出 "Artificial Intelligence in Drug Discovery "特刊,強調人工智能(AI)在制藥研究中的新興作用。本期的一個焦點是闡明人工智能方法如何開始影響藥物發現的實踐。特刊包含了從不同角度看待AI在藥物發現中的文章和觀點。

JMC | 人工智能在藥物發現中的應用:走進廣闊的天地

本期的論文涵蓋了各種方法開發工作和實際應用,讓研究者了解到人工智能是如何進入藥物發現領域的。當然,機器學習方法已經在化學資訊學和計算藥物化學中應用了二十多年,但深度學習最近已經成為包括化學在内的許多科學領域的熱門話題。

分子表征

機器學習方法建立了一個模型,用于建立輸入資料和可觀察終點之間的關系。藥物化學中通常對化學結構和實體性質或生物活性之間的關系進行模組化。這個過程中,一個關鍵的組成部分是用于将分子結構映射成可由機器學習算法處理的形式表示。分子通常被表示為編碼分子中結構模式子結構的向量。近年來,一些小組開發了使用深度學習來建立新的 "表示學習 "的方法。雖然這些學習表征的預測能力仍然是一個未知數,但它們已經顯示出有希望的初步結果。

JMC | 人工智能在藥物發現中的應用:走進廣闊的天地

推薦閱讀

藥物發現的表征學習

哈佛CASTER | 基于化學子結構表征預測藥物互相作用

iScience | 大規模表征學習尋找分子間互相作用

圖表示學習Graph Embedding綜述

模型解釋

許多機器學習方法的缺點之一是它們大多是“黑匣子預測器(black box predictors)”。藥物發現環境中,輸入化學結構并接收結果,而無需任何解釋如何或為什麼生成預測。理想情況下,研究人員希望擁有可以由人類使用者解釋的機器學習模型。模型解釋有兩個目的:首先,使用者可以檢查解釋,确認它與理論和實驗基礎相符,并對預測建立一定的信心。其次,對該模型的解釋可以為正在被模組化的生物活動背後的機理提供線索,并為新分子的設計提供靈感。

JMC | 人工智能在藥物發現中的應用:走進廣闊的天地

RaquelRodríguezPérez, Jürgen Bajorath. Interpretation of Compound Activity Predictions from Complex Machine Learning Models Using Local Approximations and Shapley Values[J]. Journal of Medicinal Chemistry, 2019.

Nat. Mach. Intell.|從局部解釋到全局了解的樹模型

NAACL | 通過對抗性修改,探究連結預測的魯棒性和可解釋性

推薦系統

提供建議的計算機系統已成為人們日常生活的一部分。例如,電子商務網站會根據人們的購買曆史記錄提供建議。線上流媒體網站會推薦人們可能喜歡的音樂和視訊。這一概念擴充到了藥物化學實驗室,如推薦有機合成路線,相似化合物的三維結構以及可能提供更多見解的測定方法。

JMC | 人工智能在藥物發現中的應用:走進廣闊的天地

An Artificial Intelligence Approach to Proactively Inspire Drug Discovery with Recommendations. Steven L. Rohall, Lydia Auch, Jonathan Gable, Jacob Gora, Johanna Jansen, Yipin Lu, Eric Martin, Margaret Pancost-Heidebrecht, Bill Shirley, Nikolaus Stiefl, and Mika Lindvall. Journal of Medicinal Chemistry 2020 63 (16), 8824-8834

DOI: 10.1021/acs.jmedchem.9b02130

反應設計

AI目前正在取得進展的化學領域之一是預測和模組化新的化學反應和合成路線。

JMC | 人工智能在藥物發現中的應用:走進廣闊的天地

JMC | 人工智能在藥物合成中的目前和未來作用(1)

JMC | 人工智能在藥物合成中的目前和未來作用(2)

JMC | 人工智能在藥物合成中的目前和未來作用(3)

Nature | 有機合成的數字化

ICML2020 | Retro*: 通過神經引導的A*搜尋學習逆合成設計

ICML2020 | G2Gs:不依賴模闆的的逆合成預測新架構

RDKit | 通過評估合成難度篩選化合物

生成模型

盡管計算化學取得了30多年的進步,但在藥物發現中,許多新分子的構想也源于藥物化學家的想象力和獨創性。從1990年開始,許多小組建立了用于進行從頭分子設計的計算機程式。這些程式通常通過在蛋白質結合位點的背景下“生長”現有分子來運作。但是,從頭設計獲得了一些成功的故事,但該技術未能獲得主流采用。過去的幾年中,研究人員看到了一種稱為生成模組化技術的興起。這個領域起源于語言模型和圖像生成,它以一組分子結構作為輸入,這些分子結構被編碼為連續的低維表示。然後可以對該表示進行解碼以生成新穎的分子。但是,化學家可能會質疑這種系統學習生成藥物樣分子所必需的實際化學反應的能力。

JMC | 人工智能在藥物發現中的應用:走進廣闊的天地

Nat. Biotech.|藥物設計的AI生成模型

J. Cheminform. | 基于SMILES的利用骨架的分子生成模型

Chem. Sci. | SyntaLinker: 基于Transformer神經網絡的片段連接配接生成器

J. Cheminform.| Mol-CycleGAN:基于Graph的分子生成優化模型

Survey | 基于生成模型的分子設計

Nat. Mach. Intell. | 利用條件循環神經網絡生成特定性質分子

Nat. Mach. Intell. | 少量資料的生成式分子設計

基于生成式深度學習方法設計潛在2019-nCoV蛋白酶抑制劑

DGL | 基于深度圖學習架構DGL的分子圖生成

GraphNVP | 用于分子圖生成的可逆流模型

繼續閱讀