天天看點

KEGG資料庫與代謝通路圖解讀

KEGG的簡介

KEGG是一個整合了基因組、化學和系統功能資訊的資料庫。把從已經完整測序的基因組中得到的基因目錄與更進階别的細胞、物種和生态系統水準的系統功能關聯起來是KEGG資料庫的特色之一。與其他資料庫相比,KEGG 的一個顯著特點就是具有強大的圖形功能,它利用圖形而不是繁缛的文字來介紹衆多的代謝途徑以及各途徑之間的關系,這樣可以使研究者能夠對其關注的代謝途徑有直覺全面的了解。

KEGG 資料庫于 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前發展為一個綜合性資料庫,其中最核心的為 KEGG PATHWAY 和 KEGG ORTHOLOGY 資料庫。在 KEGG ORTHOLOGY 資料庫中,将行使相同功能的基因聚在一起,稱為 Ortholog Groups (KO entries),每個 KO 包含多個基因資訊,并在一至多個 pathway 中發揮作用。而在 KEGG PATHWAY 資料庫中,将生物代謝通路劃分為 6 類,分别為:細胞過程(Cellular Processes)、環境資訊處理(Environmental Information Processing)、遺傳資訊處理(Genetic Information Processing)、人類疾病(Human Diseases)、新陳代謝(Metabolism)、生物體系統(Organismal Systems),其中每類又被系統分類為二、三、四層。第二層目前包括有 43 種子 pathway;第三層即為其代謝通路圖;第四層為每個代謝通路圖的具體注釋資訊。

KEGG

https://www.kegg.jp/
KEGG資料庫與代謝通路圖解讀
KEGG資料庫與代謝通路圖解讀

KEEGG代謝通路圖解讀

KEGG資料庫與代謝通路圖解讀

1、代謝通路中各種符号辨別:

代謝通路圖中,一般就是酶,方框裡面的數字代表EC編号;小圓圈代表代謝物,點開會出現C00668的資訊,C代表compound,00668是這種化合物在KEGG中的編号。

KEGG資料庫與代謝通路圖解讀

2、代謝通路中(綠)和(白)底框:

一般,KEGG中存在兩種代謝圖:

① reference pathway,根據已有的知識繪制的、概括的、詳盡的具有一般參考意義的代謝圖,為白色小框,在KEGG中名字以map開頭,比如map00010;

② species-specific pathway,綠色小框為該物種特有的基因或酶,隻有這些綠色的框有更詳細的資訊。KEGG中名字為特定物種種屬英文縮寫,比如酵母的糖酵解通路圖,sce00010。

3、KEGG富集分析:

統計該物種的富集結果,紅色邊框的為上調的,綠色邊框的為下調的。

KEGG Pathway富集分析不僅僅基于富集分析資料,人為的解讀和挑選是必不可少的。因為:

(1) 基因調控是個系統,而不僅作為1個孤立的pathway。

a. 1個基因的改變可以造成整個系統的改變;

b. 1個基因往往有多個功能,但執行具體的功能往往是不同蛋白複合物共同作用。(2) pathway富集分析的統計假設,并非在任何情況下都适用pathway富集分析,要觀察、了解某個核心pathway中基因的互相作用,才能判斷其中的基因變化是否有生物學意義。

(3) 現存KEGG等資料庫收錄的是已有研究結果,更詳細的pathway資訊需進一步完善。