人類首次完全利用AI發現「迄今最強抗生素」，登上《細胞》雜志封面

MIT 科學家用深度學習模型發現的「halicin」抗生素分子展示了前所未有的廣譜抗菌能力，這是人類首次完全使用人工智能的方法發現新抗生素。研究人員表示，halicin 可以消滅一些世界上最危險的細菌。他們的這一研究登上了生命科學頂級期刊《Cell》。

自青黴素出現以來，抗生素已經成為現代醫學的基石。然而，随着時間的推移，細菌會逐漸産生對抗生素的耐藥性，這就需要藥物研發工作者不斷開發新的抗生素。

但現實情況是，由于缺乏經濟激勵，私營藥企在新抗生素的發現上收效甚微，使得抗生素的問題越發嚴重。曾有研究預測，如果不立即采取措施開發新的抗生素，到 2050 年，因耐藥感染而死亡的人數将達到每年 1000 萬人。

在過去的幾十年裡，研發人員使用多種傳統方法挖掘新的抗生素，但很多時候，他們會一次又一次地發現相同的分子，是以新抗生素的發現步履維艱。在此背景下，生物醫學界亟需新的方法來幫助發現新抗生素。

解決 WHO「通緝令」上最危險的病原體

為了解決上述問題，來自 MIT 合成生物學中心的研究者開發了一種可以預測抗生素分子活性的深度學習方法，從超過 1.07 億種分子中識别出了強大的新型抗生素分子——halicin。halicin 可以對抗多種細菌，如肺結核以及被認為無法治療的菌株。而且，這種新發現的分子在結構上與已知的抗生素分子有很大不同。

在小鼠實驗中，該分子對多種病原體具有抗菌活性，包括艱難梭菌（Clostridioides difficile）、腸杆菌科（Enterobacteriaceae）和有「廣泛耐藥性」并迫切需要新抗生素的鮑曼不動杆菌（Acinetobacter baumannii）。其中，後兩者被世界衛生組織（WHO）列為高優先級病原體，是新抗生素三大研究目标中的兩個。

雖然之前已有使用人工智能作用于部分抗生素發現的應用案例，但研究團隊強調，此次最新發現是基于沒有任何先前假設的情況下，完全從零開始識别出的全新抗生素種類。

目前，這項研究工作由麻省理工學院（MIT）的合成生物學家 Jim Collins 主導，已發表在權威學術期刊《Cell》上，并成為當期封面文章。

「就抗生素發現而言，這絕對是第一次，」該研究的作者之一、MIT 機器學習專家 Regina Barzilay 表示。

「我們希望能夠開發一個平台，使人類能夠利用人工智能的力量來開創抗生素藥物發現的新時代。我認為 halicin 是迄今為止，人類發現的最強大抗生素之一，」MIT 團隊生物工程師 James Collins 補充道。「它對于大量抗藥性病原體展示了顯著的活性。」

論文連結：

https://www.cell.com/cell/fulltext/S0092-8674(20)30102-1

賓夕法尼亞州匹茲堡大學的計算生物學家 Jacob Durrant 表示，此項研究意義非凡，研究團隊不僅确認了候選分子，同時還在動物實驗中驗證了有潛力的分子。更重要的是，這種方法具有一定的泛化性，可以應用于其他類型的藥物研究，例如用于治療癌症或者是神經退行性的疾病。

發現過程

在尋找新抗生素的過程中，研究者訓練了一個深度神經網絡，以尋找抑制大腸杆菌生長的分子。在訓練過程中，他們用到了 2335 個已知具有抗菌活性的分子，包括大約 300 種已獲批的抗生素和 800 種從植物、動物和微生物中得到的天然産物。

在這項研究中，模型不需要知道關于藥物機理的假設，也不需要化學基團的标注就能執行預測。該模型能夠學習人類專家未知的新模式。

訓練完成後，研究者用該模型在一個名為「Drug Repurposing Hub」的庫中進行分子篩選，裡面有大約 6000 種正處于研究階段的對抗人類疾病的藥物分子。

此次篩選的目的是看哪種分子能對抗大腸杆菌，并挑選出那些看起來和正常抗生素不一樣的分子。從這些結果裡再選出 100 個候選分子進行實體試驗，

結果，他們發現，一種名為「halicin」的分子效果很好，而這一分子正處于針對糖尿病治療的研究階段。在小鼠實驗中，該分子對多種病原體具有抗菌活性，包括艱難梭菌、腸杆菌科和有「廣泛耐藥性」并迫切需要新抗生素的鮑曼不動杆菌。

論文的圖檔摘要。

抗生素分子的圖模組化

整體來看，神經網絡起到的作用就是預測不同分子結構最終對大腸杆菌的抑制能力。按照正常思維，我們需要一個資料集，其中輸入特征是分子的組成部分與結構，标注為對大腸杆菌的抑制能力。而神經網絡的優勢在于，它能以一個自己學習的向量來表征分子，而不是手工設計的特征向量。

在這篇論文中，研究者表示有向資訊傳遞網絡能直接從分子的圖結構預測分子的屬性，其中原子可以表示為節點，化學鍵可以表示為邊。對于每一個化學分子，研究者針對每一個組成部分的 SMILES 表達式建立分子圖，其中 SMILES 是一種用 ASCII 字元串明确描述分子結構的規範。

在初始化特征向量時，它又分為原子特征向量與化學鍵特征向量。如下最左邊的神經網絡模組化，其最上面為一個分子圖，第 3 個原子和第 4 個原子都有連向第 2 個原子的化學鍵（Bond），下面兩個黑色的向量表示這兩個連接配接。以此類推，紅色向量表示第 2 個原子連接配接到第 1 個原子的化學鍵。

、

該模型應用了一系列資訊傳遞步驟，它會聚合鄰近原子與化學鍵的資訊，進而了解局部分子的化學性質。在有向資訊傳遞網絡的每次資訊傳遞過程中，通過求和鄰近化學鍵特征向量，并饋送到非線性單層神經網絡中，化學鍵特征向量能得到更新。

經過固定次數的資訊傳遞步驟，整個分子學到的各種特征向量會加和為單個向量，并饋送到前饋神經網絡以預測該化學分子對大腸杆菌的抑制效果。後面的 FFN 就是非常正常的二分類問題了，是以整個抗生素分子模組化最重要的就是第一步的圖模型：如何用圖與向量表示分子之間的複雜關系。

這項開創性的工作标志着抗生素發現乃至更普遍的新藥研發方法發生了範式轉變。未來，MIT 的研究人員還計劃使用深度學習模型來設計新的抗生素，并優化現有的分子。

其實，抗生素分子的發現隻是機器學習在藥物挖掘領域應用的冰山一角，全球各地的學者都在嘗試用機器學習技術加快新藥研發進度。以新型冠狀病毒的新藥研發為例，部分 AI 藥物研發公司已經開始嘗試用多種深度學習模型進行藥物分子的挖掘（如英科智能利用二十多種模型尋找對新冠病毒關鍵蛋白酶有抑制作用的分子），相關成果也在陸續公布。

參考内容：

https://www.nature.com/articles/d41586-020-00018-3 http://news.mit.edu/2020/artificial-intelligence-identifies-new-antibiotic-0220 https://www.theguardian.com/society/2020/feb/20/antibiotic-that-kills-drug-resistant-bacteria-discovered-through-ai https://insilico.com/ncov-sprint

人類首次完全利用AI發現「迄今最強抗生素」，登上《細胞》雜志封面

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普