天天看點

DeeplyTough | 學習蛋白質結合位點的結構比較

DeeplyTough | 學習蛋白質結合位點的結構比較

小分子藥物發現中的蛋白質

蛋白質在體内發揮作用,并負責生物學功能。在藥物開發中,經常尋求改變特定蛋白質的功能來幫助人體抵抗疾病。可以将專注于用小分子藥物調節特定蛋白質的藥物發現工作架構化為基于靶标的藥物發現。蛋白質的生物學功能取決于其結構和序列。影響蛋白質功能的最常見方法是幹擾能夠容納小分子的蛋白質-配體結合位點或口袋。

DeeplyTough | 學習蛋白質結合位點的結構比較

靶标蛋白質空間的相似性

找出分子可以結合的蛋白質是藥物研發的核心任務。可能知道一個分子結合一種蛋白質,但懷疑其他分子也互相作用,這可能會導緻藥物毒性或多藥理學。相反,可能不知道會結合感興趣的蛋白質的分子,并希望從虛拟篩選方案中獲得會結合相似蛋白質結合位點的分子中汲取靈感。

DeeplyTough | 學習蛋白質結合位點的結構比較

不相關的蛋白質可能結合相似的分子。

傳統的口袋配對方法

評估3D蛋白質口袋之間相似性的傳統方法通常基于口袋的手動建立表示法和傳統形狀比對算法的組合。假設一種用于口袋比對的機器學習方法将能夠直接從資料中學習口袋表示,同時了解口袋的哪些特征對于共享分子的結合特别重要。通過引入基于機器學習的解決方案來解決口袋比對問題,希望消除人為偏見,并為藥物開發量身定制口袋表示。

DeeplyTough:一種3D口袋比對的機器學習方法

BenevolentAI的最新研究通過計算機視覺的來檢視蛋白質口袋的比對情況,将3D蛋白質結構視為3D圖像。卷積神經網絡(CNN)在許多領域都被證明是有效的,并且能夠建構來自低級像素的強大輸入表示-3D像素除外,即像素稱為體素。與圖像相反,圖像中的每個像素都由紅色,綠色和藍色(rgb)的強度表示,研究者用分子特性(例如疏水性或原子形成氫鍵的能力)代替了附加的原色。

DeeplyTough | 學習蛋白質結合位點的結構比較

蛋白質結構以3D圖像為特征,其中與紅色,綠色和藍色強度相關的像素被與可能的分子間互相作用描述相關的3D體素代替。

Metric Learning

距離度量學習領域旨在自動确定項目之間的距離,并且可以在給定标記示例資料集的情況下以機器學習方式進行訓練。案例中,TOUGH-M1資料集包含正對(兩個蛋白質口袋,已顯示出結合相似分子)和負對(兩個蛋白質口袋,均未顯示出共享分子結合的證據)的示例。研究者對DeeplyTough進行訓練以鼓勵負對的分離,并在歐氏空間中接近正對。

研究者使用三個可公開獲得的資料集對他們的方法進行了全面的基準測試,并證明了用于3D口袋比對的度量學習方法可以在運作時更快的時間内顯示出與現有方法競争的性能。該工作代表了一種概念驗證,表明度量學習能夠比對可能直接從3D蛋白質結構資料中結合相似配體的蛋白質口袋。蛋白質口袋比對的方法是現代藥物發現工具包中的一種工具。引入了DeeplyTough,這種範式的轉變減少了與以前方法相關的人為偏見,并降低了運作時時間成本,使研究者能夠考慮更大的資料集。DeeplyTough将提高有效搜尋新藥的能力。

繼續閱讀