天天看點

Nat. Mach. Intell.| 機器學習顯著降低藥物組合篩選成本

今天給大家介紹2019年12月發表在Nature Machine Intelligence的論文“Prediction of drug combination effects with a minimal set of experiments”,該工作由芬蘭分子醫學研究所(FIMM)的研究者完成。本研究建立機器學習模型,通過極少量的實驗就可以對藥物組合效應進行預測,是以能顯著降低藥物組合的篩選成本。

Nat. Mach. Intell.| 機器學習顯著降低藥物組合篩選成本

1、研究背景

藥物組合療法已成為一些複雜疾病的标準治療方法,與單一藥物治療相比,聯合用藥可以提高治療效果同時降低毒副作用。高通量篩選(HTS)使得在臨床前的模型系統中分析成千上萬種藥物組合的表型效應成為可能。但是,由于大量潛在的藥物和劑量組合,大規模的多劑量矩陣分析篩選實驗成本過于昂貴,這超出了大多數學術實驗室的能力。

為了使高通量藥物組合篩選在實際項目中更加可行,一種解決劑量或藥物組合爆炸問題的方案是僅使用多劑量反應矩陣的一部分資料進行預測。FIMM研究團隊提出一種高效的機器學習方法DECREASE(藥物組合反應預測),使用最少的實驗對藥物組合協同效應進行預測。DECREASE的模型輸入為劑量矩陣的單行單列或對角線,檢測其離群值,然後使用新型複合非負矩陣分解(cNMF)算法和正則化增強回歸樹(XGBoost)算法預測完全劑量反應矩陣,最後使用標明的參考模型(例如Loewe,Bliss,HAS或ZIP)來計算藥物組合的總協同作用評分,通過進一步的實驗或臨床驗證确定最具協同作用的組合。DECREASE的實作示意圖如圖1所示。

Nat. Mach. Intell.| 機器學習顯著降低藥物組合篩選成本

圖1 DECREASE實作示意圖

2、方法

2.1 内部組合實驗

在13個癌細胞系中測試了34種不同的化合物,總共包括210種抗癌組合。用192種抗癌藥物組合在10個乳腺癌細胞系中進行了8*8矩陣實驗來建立DECREASE模型。另外18種用于驗證模型預測的抗癌組合也使用相同的方法在HEK293(胚胎腎)、HeLa(宮頸癌)和Hep G2(肝細胞癌)細胞系中進行8*8的矩陣實驗。所有的細胞系都在更大的體積中生長,使用基于PCR的檢測試劑盒制備實驗用細胞并将其冷凍在安瓿中,并定期檢測支原體。

2.2 公布的組合資料集

第一個公布的資料集是在ABC DLBCL系TMD8中做了466個6*6矩陣實驗來檢測466種抗癌化合物與依魯替尼的聯合作用。第二個公布的資料集包括29種不同化合物中的104種抗瘧組合,在惡性瘧原蟲株HB3的10*10矩陣設計中進行了測試。第三個公布的抗癌資料集來自于奧尼爾和其他科學家的研究,總共包括22,737個實驗,583個成對組合,使用4*4劑量方案對從ATCC或Sigma-Aldrich獲得的39個不同癌細胞系進行測試。第四個公布的資料集包含78種抗病毒藥物組合,在感染了馬科納病毒和埃博拉病毒的Huh7肝細胞中進行了測試。

2.3 DECREASE工作流程

DECREASE預測方法主要由兩階段構成:(1)對有限的測量實驗設計(如固定濃度或對角設計)獲得的稀疏矩陣進行離群值檢測;(2)使用cNMF算法預測完全劑量反應矩陣。最後,通過任意一種協同模型識别最好的協同藥物組合。

1

離群值檢測

g*12(d1,d2) = g1(d1) + g2(d2) − g1(d1)g2(d2)                 (1)

計算測量和預期的組合響應之間的偏差的公式如下:

gd(d1,d2) = |g12(d1,d2) − g*12(d1,d2)|                 (2)

其中g12(d1,d2)是實驗測量的組合效應。然後,gd(d1,d2)中的離群點X(d1,d2)被定義為以下觀測值:(1)低于Q1 − 4 × IQR或高于Q3 + 4 × IQR,Q1和Q3分别是第一和第三個四分位數,IQR是四分位數之間的範圍;(2)偏離測量的抑制水準超過25%。

由于劑量反應矩陣中的藥物組合抑制反應通常是濃度水準的非單調函數,在任何濃度範圍内都可能發生藥物協同或拮抗作用,是以,基于标準分布的方法都不适用于離群值的檢測。這也使發現兩個位置接近的離群值變得複雜,因為它們可能與協同區或拮抗區混淆。為了檢測用于模型訓練的組合和單個藥物反應測量中的離群值,我們應用了一種基于Bliss近似的新政策。計算單一藥劑在d1和d2濃度下的預期組合反應的公式如下:

2

完全矩陣預測

在去除離群值後,預測稀疏劑量反應矩陣中的缺失反應。由于反應值總是非負的(抑制範圍在0%到100%之間),是以使用限制權重非負矩陣因式分解(NMF)來預測藥物組合反應矩陣。限制的NMF增加了額外的正則化限制,以減少過度拟合,增強模型估計解的唯一性。

3

協同評分和檢測

利用預測的完全劑量反應矩陣,使用標明的協同評分參考模型計算全濃度範圍内的組合形勢。藥物對的總體協同作用評分是通過使用SynergyFinder的劑量效應組合矩陣計算預測和預期協同作用之間的平均得分。正負分數分别表示協同作用和拮抗作用。

4

比較評價

使用192種抗癌組合的内部資料集,比較了cNMF和7種最先進的監督機器學習算法在預測稀疏劑量反應矩陣缺失值方面的預測準确性。對比分析表明,cNMF的性能優于其他所有監督機器學習算法。

2.3 統計分析

使用Bliss、Loewe、HSA或ZIP模型,通過計算預測和預期協同作用得分之間的Pearson相關系數,評估協同作用檢測的預測準确性。用r.m.s.e.評估劑量組合模式的預測準确性。

3、結果

3.1 使用DECREASE預測抗癌藥物的協同作用

DECREASE基于已準許的藥物和正在研究的化合物的192種抗癌藥物組合在10個乳腺癌細胞系中進行了8*8劑量反應矩陣的測試。圖2展示了使用不同濃度設計預測得到的模型的協同作用分數的皮爾遜相關系數。對比分析表明,采用新型的cNMF方法,結合廣泛使用的正則化增強回歸樹(XGBoost)算法,可以獲得最佳的預測精度。

Nat. Mach. Intell.| 機器學習顯著降低藥物組合篩選成本

圖2 DECREASE通過高通量實驗資料篩選設計,準确預測藥物組合效應

3.2 預測劑量組合表面的準确性

DECREASE模型的主要目的是預測被測藥物對之間的協同效應。此外,還研究了通過DECREASE預測的完全劑量反應矩陣在不同濃度水準(所謂的結合面,combination surface)上捕獲組合劑量反應模式的準确性。根據DECREASE模型預測出的Bliss協同面與基于完全劑量響應組合矩陣計算出的Bliss協同面相似,如圖3所示。

Nat. Mach. Intell.| 機器學習顯著降低藥物組合篩選成本

圖3 DECREASE精确預測了固定濃度的藥物組合景觀

3.3 被測子矩陣對DECREASE精度的影響

通過各種實驗設計找出哪些劑量反應矩陣的濃度才能獲得最大的預測性能,可以了解它們為協同預測提供了多少資訊。當選擇劑量反應矩陣的中間行之一進行模型訓練時,預測效果最好,如圖4a所示。值得注意的是,添加劑量反應矩陣的其他濃度行并沒有顯著提高協同預測性能,如圖4b所示。

Nat. Mach. Intell.| 機器學習顯著降低藥物組合篩選成本

圖4 選擇和使用劑量反應矩陣行預測藥物聯合效應

3.4 DECREASE應用于非癌症藥物組合資料

為了說明DECREASE模型在非癌症組合篩選的廣泛适用性和性能,使用已發表的包含104種抗瘧藥物組合的資料集在惡性瘧原蟲HB3株中進行了測試。DECREASE在使用固定濃度和對角線設計時可以确定最具協同和拮抗作用的藥物組合。在另一個非癌症應用案例中,DECREASE在78種用于埃博拉治療的藥物組合中篩選出最有效的協同抗病毒組合,與DLBCL和瘧疾的應用類似,使用DECREASE模型對藥物組合效應具有很高的預測準确性。實驗結果如圖5所示。

Nat. Mach. Intell.| 機器學習顯著降低藥物組合篩選成本

圖5 DECREASE能準确預測抗瘧疾藥物和抗病毒藥物的組合效應

4、讨論

為了降低高通量藥物組合實驗所需的成本和時間,本文提出了一種高效的基于機器學習模型的方法--DECREASE,僅用最少的一組測量值來預測最有效的藥物協同組合。本文使用53個癌細胞系中測試的23595種成對藥物組合,以及在瘧疾和埃博拉感染模型中測試的藥物組合來證明使用機器學習方法能夠獲得與完全劑量組合矩陣所提供的幾乎相同的資訊含量。實驗結果還表明,DECREASE有助于加快原發性患者樣本中的藥物組合試驗,并可以廣泛适用于各種生物醫學問題。

本文目前工作重點為成對藥物組合效應預測,在未來的研究中,一旦有足夠的高階劑量反應張量資料可用于預測,将會使用DECREASE模型預測高階藥物組合效應。未來另一個研究方向是評估用于臨床應用的藥物組合的潛在毒副作用。

Data availability

http://decrease.fimm.fi/data_availability https://github.com/IanevskiAleksandr/DECREASE/tree/master/210_Novel_Anticancer_combinations

Code availability

http://decrease.fimm.fi/source_code https://github.com/IanevskiAleksandr/DECREASE

繼續閱讀