天天看點

基于元路徑分層Transformer和注意力網絡的藥物-靶标互相作用預測

作者:AIDDPro
基于元路徑分層Transformer和注意力網絡的藥物-靶标互相作用預測

今天給大家講一篇2023年3月在Briefings in Bioinformatics上發表的一篇藥物靶标互作的文章,作者提出了一種藥物-靶标互相作用預測的基于元路徑的分層變壓器和Transformer方法(MHTAN-DTI),通過引入不同元路徑執行個體的不同權重以獲得特定語義的節點嵌入,運用注意力機制主要捕捉不同元路徑類型的重要性,并執行權重融合以獲得最終的節點嵌入表征。與其他DTI預測方法相比,MHTAN-DTI的預測性能具有顯著優勢。此外,還進行了消融實驗。結果表明,多種異構資訊在預測DTI方面的重要性,且具有一定的可解釋性,加速藥物設計的程序。

藥物靶标作用研究背景

在早期藥物發現中,靶标的選擇和确認尤為重要。藥物-靶點互相作用的預測對于識别新的配體與特定靶标之間的互相作用、多藥理學研究和耐藥性研究具有重要意義。自2019年12月以來,高傳染性且具有潛伏性的2019冠狀病毒(COVID-19)迅速蔓延,并對人類健康構成嚴重威脅。是以了解藥物靶标資訊有助于預測脫靶毒性及其療效,也為研究藥物副作用的機制提供了新的視角。其中藥物靶标互相作用的評估名額有最大半抑制濃度(IC50),抑制常數(Ki)和解離常數(Kd)等。現有基準方法有引入藥物-藥物互相作用、藥物-疾病互作、藥物-副作用、蛋白-蛋白和蛋白-疾病互作等資訊來提高預測效果,它們包含了與藥靶作用相關的潛在資訊。然而,如何有效地利用節點間的拓撲結構來提升藥靶作用的預測很難解決。本文作者提出了一種基于元路徑的Transformer模型及注意力網絡(MHTAN-DTI)的藥靶作用預測方法。首先,建構了一個包含708種藥物、1512種蛋白、5603種疾病和4192種副作用的異質性生物資訊學網絡。網絡中邊的特征包括藥物-藥物互作、藥物-蛋白互作、藥物-疾病互作、藥物-副作用互作、蛋白-蛋白互作和蛋白-疾病互作的資訊。該模型基于異構生物資訊學網絡生成藥物和蛋白質的低維向量來實作精準的藥靶作用預測。

MHTAN-DTI模型介紹

2.1 模型架構

作者提出了一種Transformer及注意力網絡的方法來預測藥物靶标互相作用。如圖1所示,首先,建構了一個包含四種節點類型的異質生物資訊學網絡:藥物、靶點、疾病和副作用。然後,依次使用Transformer及注意力網絡,将生物網絡的結構及語義資訊編碼為藥物和靶标的低維潛在嵌入。其中元路徑執行個體Transformer對元路徑執行個體進行内部聚合,單語義注意力将相同元路徑類型的元路徑執行個體與節點本身結合起來,多語義注意力融合多個單語義節點嵌入,得到最終的節點嵌入。并最終輸出一個二值分類結果,通過交叉熵損失函數來更新模型的權重系數。

基于元路徑分層Transformer和注意力網絡的藥物-靶标互相作用預測

圖1 MHTAN-DTI設計流程

實驗結果

3.1基準方法評估與比較

如圖2所示,作者驗證了MHTAN-DTI在建構的元路徑資料集上的性能,并将MHTAN-DTI與7種最先進的DTI預測方法(BLMNII、CMF、NetLapRLS、NRLMF、DTINet、NeoDTI和EEG-DTI)進行了比較。實驗結果表明,MHTAN-DTI在DTI預測性能方面表現最佳。與7種對照實驗方法的最佳結果相比,MHTAN-DTI的AUROC提高了3.01%,AUPR提高了2.71%。

而其餘方法則效果不佳,可能是由于它們捕獲的相關特征相對有限。此外,從無監督學習中學到的嵌入表征很可能不适合DTI預測。是以,MHTAN-DTI通過結合元路徑執行個體級變換、單語義注意和多語義注意,能夠更好地捕獲藥物-蛋白質互相作用的關鍵特征,進而在性能上取得顯著的改進。

基于元路徑分層Transformer和注意力網絡的藥物-靶标互相作用預測

圖2 基準方法比較

3.2 消融實驗分析

作者引入了Transformer編碼器作為元路徑執行個體的聚合器。為了評估不同元路徑執行個體編碼器對MHTAN-DTI的影響,還使用了雙向長短時記憶網絡(BiLSTM)編碼器、平均編碼器和最大池化編碼器的方式作為基準比較。此外,還進行了一個額外的實驗,即隻利用基于元路徑的鄰居資訊,而沒有使用任何元路徑執行個體編碼器。如圖3所示,在沒有對中間節點進行聚合的情況下,AUROC和AUPR名額會明顯下降,這表明藥物和蛋白質的最終嵌入喪失了重要資訊。此外,除了Transformer編碼器之外,BiLSTM編碼器在性能上表現得最好。平均編碼器和最大池化編碼器也取得了良好的實驗結果。Transformer編碼器相較于僅考慮基于元路徑的鄰居資訊實作了顯著的性能提升,表明該編碼器在元路徑執行個體上的有效性。

基于元路徑分層Transformer和注意力網絡的藥物-靶标互相作用預測

圖3 元路徑執行個體編碼器的消融實驗

結論

作者建構了一種基于元路徑的Transformer且結合注意力網絡的藥物-蛋白質互相作用(DTI)預測方法。首先,建構了一個基于元路徑的異構生物資訊學網絡。基于元路徑類型來來表征資料的方法使得模型具有可解釋性。此外,還采用了Transformer編碼器和雙層注意力機制來擷取蛋白及化合物序列的語義資訊進而生成二者的低維向量,最終用于DTI預測。可以發現Transformer編碼器有助于捕獲元路徑執行個體之間的依賴關系,而雙層注意力網絡也減輕了噪聲對預測性能的影響。

進一步,為了驗證MHTAN-DTI的有效性和魯棒性,作者将其與7種不同的DTI預測方法進行了比較。實驗結果顯示,MHTAN-DTI在性能上表現出競争性的優勢。此外,還進行了消融研究,證明了不同元路徑類型和MHTAN-DTI的不同組成部分對提高DTI預測性能的貢獻。這些發現強調了MHTAN-DTI作為一種強大的DTI預測方法的潛力和可應用性。

參考文獻

  1. Cummings, M. D. & Sekharan, S. Structure-based macrocycle design in small-molecule drug discovery and simple metrics to identify opportunities for macrocyclization of small-molecule ligands. J. Med. Chem. 62, 6843–6853 (2019)

版權資訊

本文系AIDD Pro接受的外部投稿,文中所述觀點僅代表作者本人觀點,不代表AIDD Pro平台,如您發現釋出内容有任何版權侵擾或者其他資訊錯誤解讀,請及時聯系AIDD Pro (請添加微信号sixiali_fox59)進行删改處理。

原創内容未經授權,禁止轉載至其他平台。有問題可發郵件至[email protected]