天天看點

IID | 組織特異性蛋白互相作用預測資料庫

在基因的互相作用分析預測方面,我們介紹過 [[STRING-蛋白互相作用資料庫使用 | STRING]], [[BioGRID-蛋白,化學物質互相作用資料庫 V4.4 | BioGRID]] 更加偏向于蛋白之間的互相作用預測。[[IncAct-基因互相作用分析資料庫 | IncAct]] 是一個多組學的預測資料庫。而 [[ConsensusPathDB-綜合性互相作用分析資料庫 | ConsensusPathDB]] 則是一個解釋蛋白質-蛋白質、遺傳、代謝、信号、基因調控和藥物-靶标互相作用的資料庫。但是對于基因互相作用而言,在不同的組織和疾病當中調控關系肯定也是不一樣的。是以在進行互相作用預測的時候也要基于特定的環境來進行預測。今天就介紹一個基于特定環境預測互相作用關系的資料庫:IID: http://iid.ophid.utoronto.ca/ 。

IID | 組織特異性蛋白互相作用預測資料庫

背景資料集介紹

由于 IID 要進行組織特異性的互相作用網絡。是以就需要收集兩個方面的資料

互相作用資訊

首先就需要收集蛋白之間的互相作用關系。IID 的互相作用資訊主要來自于三個方面:

  1. 收集了十個大型的實驗驗證的互相作用資料庫 (BCI, BIND, BioGRID, DIP, HPRD, I2D, InnateDB, IntAct, MatrixDB, MINT);
  2. 直系蛋白的互相作用資訊
  3. 基于多個計算方法來預測互相作用資訊 (Rhodes, Nat. Biotech., 2005; Elefsinioti, Mol. Cell Proteomics, 2011; Zhang, Nature, 2012; Kotlyar Nat. Methods, 2015)

組織特異性

為了了解基因在特定組織的特異性,作者利用多個 GEO 公共資料集來分析基因在不同的組織當中的表達情況。例如,作者使用 GSE18290 來分析基因在不同發育階段的表達情況。

IID | 組織特異性蛋白互相作用預測資料庫

基于第一部分的結果,可以知道哪兩個基因存在互相作用關系。進一步如果這兩個基因在某一個組織當中都有一定的表達量,那麼就認為這兩個基因在這個這個組織當中存在互相作用關系。

資料庫使用

在 IID 當中支援多個基因的輸入,最多可以輸入 1000 個基因。同時 IID 支援三種基因格式:基因名,UniProt ID 以及 Entrez ID ([[gene-基因基本資訊查詢資料庫 | gene資料庫]])。

IID | 組織特異性蛋白互相作用預測資料庫

在輸入想要檢視的互相作用之後,首先可以選擇互相作用的方式以及實驗性證據的最小個數。

IID | 組織特異性蛋白互相作用預測資料庫

其次如果有想要觀察特定組織/疾病的内的互相作用。可以進一步進行選擇。這裡我們選擇在胃癌當中關系互相作用關系。

IID | 組織特異性蛋白互相作用預測資料庫

輸出結果方面,主要是通過表格和網絡圖的方式來進行展示的。在證據類型當中,也展示了是預測還是實驗的結果。

IID | 組織特異性蛋白互相作用預測資料庫

總的來說

以上就是 IID 的主要使用方法。相較于其他互相作用資料庫。IID 主要是增加了關于組織特異性的表達情況的資料。進而确定具體的互相作用蛋白是否在特定組織當中表達。

對于來自于其他的資料庫的互相作用資訊而言,如果資料不跟随原始資料庫實時更新的話,有可能會造成預測資訊滞後的情況。例如最近的 IID 下載下傳的 BioGRID 的資料是 2021-04-07。而 BioGRID 幾乎每個月都會有一次資料更新。11月份和4月份的資料已經有很大的差別了。

IID | 組織特異性蛋白互相作用預測資料庫