天天看點

Drug Discovery Today | 頻繁命中化合物機制探究:PAINS規則的局限性

頻繁出現的假陽性結果對高效的藥物研發是一個極大的挑戰。為了能夠提前篩選假陽性化合物,避免無效的成本和投入,2010年Baell等人提出一套PAINS篩選規則(Pan-assay interference compounds)用于假陽性化合物篩選。然而,在後續研究中發現,PAINS篩選規則對于假陽性化合物篩選的有效性和正确性有待考證。基于這個問題,本文收集了一個涵蓋6種常見頻繁命中化合物機制且包含600,000分子的大型基準資料集用于PAINS規則測評。

Drug Discovery Today | 頻繁命中化合物機制探究:PAINS規則的局限性

背景

高通量篩選是藥物研發的一個重要手段,然而研究中發現一些化合物在不同類型靶點篩選中均表現出陽性結果,這類化合物稱為“頻繁命中化合物”。其中,通過幹擾實驗條件而在多個實驗中呈現出陽性結果的假陽性化合物是應該在藥物研發前期盡量避免的無效投入。2010年,Baell等人在基于六個不同靶點AlphaScreen高通量篩選實驗結果,并将其中頻繁出現(≥4次)的化合物和相關結構總結為包含480個子結構的篩選規則PAINS(Pan-assay interference compounds)用于假陽性化合物篩選。這篇文章在Google Scholarship的引用次數已經超過2090次,藥學領域權威雜志《Journal of Medicinal Chemistry》要求作者在送出論文時必須附帶研究分子通過PAINS篩選規則的結果,對于含有PAINS子結構的化合物需要提供實驗資料證明該化合物不是頻繁命中化合物。然而,在實際應用中,PAINS規則篩選的化合物類型實際多種多樣且甚至互相沖突的,包括無活性化合物、已上市藥物及候選化合物等。由于機制的不明确,使得後續PAINS規則篩選化合物的處理複雜且不明朗。

資料庫篩選

為了探究PAINS規則背後的機制和篩選能力,課題組從文獻及資料庫中收集到6種常見頻繁命中化合物機制的大型基準資料集,包括膠體聚集化合物、自熒光化合物、熒光酶抑制劑、易反應化合物和多靶點化合物。經過一系列分子預處理,包含正集和負集,超過600,000個分子用于PAINS規則測評。

Drug Discovery Today | 頻繁命中化合物機制探究:PAINS規則的局限性

圖1. PAINS規則測評結果

結果發現,PAINS規則隻能大約檢測出10%的頻繁命中化合物,平均正确率在42%左右。後續對于PAINS子結構具體分析的環節發現,雖然部分PAINS子結構對于頻繁命中化合物有鑒别能力,但是仍然有241個PAINS子結構在這次篩選中并未檢測到,結合後續對從 ZINC資料庫中收集的400,000,000可購買分子的PAINS篩選結果,仍然有超過13%的PAINS子結構在這兩次篩選中都未出現。以上資料表明PAINS規則仍需改進。

Drug Discovery Today | 頻繁命中化合物機制探究:PAINS規則的局限性

圖2. PAINS規則具體情況

與其他規則比較

為了進一步探究PAINS規則的篩選能力,課題組收集了一些其他常用的頻繁命中化合物篩選規則用于基準資料集篩選。結果表明,相較PAINS規則,機制分明的規則的篩選結果普遍更高效且更準确。這個結果也說明探究原始資料機制對于規則篩選能力的重要性。

Drug Discovery Today | 頻繁命中化合物機制探究:PAINS規則的局限性

總結

頻繁命中化合物的篩選對于藥物正常高效研發具有重要作用,然而現今使用的PAINS子結構規則仍有較大的發展空間,後續相關篩選規則的發展需要注意:(1). 機制分明的原始資料集,包含正集和負集;(2). 對于子結構規則的合理編排;(3). 與篩選模型的結合,互相補充。