DeeplyTough | 學習蛋白質結合位點的結構比較

2021-12-08 23:50:00

小分子藥物發現中的蛋白質

蛋白質在體内發揮作用，并負責生物學功能。在藥物開發中，經常尋求改變特定蛋白質的功能來幫助人體抵抗疾病。可以将專注于用小分子藥物調節特定蛋白質的藥物發現工作架構化為基于靶标的藥物發現。蛋白質的生物學功能取決于其結構和序列。影響蛋白質功能的最常見方法是幹擾能夠容納小分子的蛋白質-配體結合位點或口袋。

靶标蛋白質空間的相似性

找出分子可以結合的蛋白質是藥物研發的核心任務。可能知道一個分子結合一種蛋白質，但懷疑其他分子也互相作用，這可能會導緻藥物毒性或多藥理學。相反，可能不知道會結合感興趣的蛋白質的分子，并希望從虛拟篩選方案中獲得會結合相似蛋白質結合位點的分子中汲取靈感。

不相關的蛋白質可能結合相似的分子。

傳統的口袋配對方法

評估3D蛋白質口袋之間相似性的傳統方法通常基于口袋的手動建立表示法和傳統形狀比對算法的組合。假設一種用于口袋比對的機器學習方法将能夠直接從資料中學習口袋表示，同時了解口袋的哪些特征對于共享分子的結合特别重要。通過引入基于機器學習的解決方案來解決口袋比對問題，希望消除人為偏見，并為藥物開發量身定制口袋表示。

DeeplyTough：一種3D口袋比對的機器學習方法

BenevolentAI的最新研究通過計算機視覺的來檢視蛋白質口袋的比對情況，将3D蛋白質結構視為3D圖像。卷積神經網絡（CNN）在許多領域都被證明是有效的，并且能夠建構來自低級像素的強大輸入表示-3D像素除外，即像素稱為體素。與圖像相反，圖像中的每個像素都由紅色，綠色和藍色（rgb）的強度表示，研究者用分子特性（例如疏水性或原子形成氫鍵的能力）代替了附加的原色。

蛋白質結構以3D圖像為特征，其中與紅色，綠色和藍色強度相關的像素被與可能的分子間互相作用描述相關的3D體素代替。

Metric Learning

距離度量學習領域旨在自動确定項目之間的距離，并且可以在給定标記示例資料集的情況下以機器學習方式進行訓練。案例中，TOUGH-M1資料集包含正對（兩個蛋白質口袋，已顯示出結合相似分子）和負對（兩個蛋白質口袋，均未顯示出共享分子結合的證據）的示例。研究者對DeeplyTough進行訓練以鼓勵負對的分離，并在歐氏空間中接近正對。

研究者使用三個可公開獲得的資料集對他們的方法進行了全面的基準測試，并證明了用于3D口袋比對的度量學習方法可以在運作時更快的時間内顯示出與現有方法競争的性能。該工作代表了一種概念驗證，表明度量學習能夠比對可能直接從3D蛋白質結構資料中結合相似配體的蛋白質口袋。蛋白質口袋比對的方法是現代藥物發現工具包中的一種工具。引入了DeeplyTough，這種範式的轉變減少了與以前方法相關的人為偏見，并降低了運作時時間成本，使研究者能夠考慮更大的資料集。DeeplyTough将提高有效搜尋新藥的能力。

DeeplyTough | 學習蛋白質結合位點的結構比較

靶标蛋白質空間的相似性

繼續閱讀

查找算法之二分查找查找算法之二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

CQ V1.0分詞bates(基于雙數組tire樹)—應該是目前最快的中文分詞算法

Command Network(POJ 3164)---定根最小樹形圖模闆題題目描述輸入格式輸出格式輸入樣例輸出樣例分析源程式

開源低帶寬語音編解碼器

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

極大似然法(ML)與最大期望法(EM)

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希