在前面的3期中,我們給大家講解了網絡圖的構造、 STRING資料庫和Cytoscape軟體的安裝,連結如下:
從網絡圖探尋基因互作的蛛絲馬迹(1)
【科研貓·繪圖】從網絡圖探尋基因互作的蛛絲馬迹(2)
從網絡圖探尋基因互作的蛛絲馬迹(3)
還記得我們的研究課題嗎?
如何從100多個差異表達的基因當中快速鎖定關鍵基因
這個課題的分析步驟分了幾個步驟:
1、從基因清單到蛋白互作;
2、從蛋白互作到互作網絡;
3、從互作網絡到關鍵基因。
我們已經完成了第一步,并且在 STRING 資料庫當中繪制了一個簡單的網絡圖,可惜這個網絡圖沒有辦法進一步在 STRING 當中進行美化,也沒辦法通過算法找到裡面的關鍵基因,怎麼辦呢?
這時候就依賴 Cytoscape 了,關于 Cytoscape 的軟體簡介和安裝調試我們已經講過了,這次,我們就來示範最關鍵的内容,Cytoscape的使用。我們還是從上次的執行個體出發,邊示範邊講解。
Attention
軟體操作略複雜,
是以文末配備了超長無碼講解視訊。
檔案導入
網絡檔案格式包括多種格式:TXT、SIF、GML等,這些都是 Cytoscape 能夠識别的,其中最常用的就是 TXT 文本檔案。這種格式是最簡單的,其實就是從 Excel 中複制出來的表格,其格式是這樣的:
(1)第一行,預設作為列名,是以不要有重複性的名字;從第二行開始就是結點(node)之間的互相作用關系了;
(2) 資料至少包含兩列,第一列是Source Node,第二列是Target Node;
就拿我們從STRING生成的網絡圖源檔案為例,我們生成的是一個名為string_interactions.tsv的檔案,這是一個文本檔案,我們用Excel把它打開之後是這樣子的:

導入檔案怎麼導入呢?打開Cytosacpe,找到 File-Import-Network from File 即可導入檔案。
點選導入檔案,找到你的網絡源檔案,也就是我們這裡的 string_interactions.tsv 檔案,導入之後是這樣的,軟體會自動幫我們識别最重要的兩列:Source node和 Target node,一般就是前面兩列,一般識别的都是對的。
如果識别的不對,很簡單,點選一下表頭,會有個下拉菜單,我們自己選擇、自己指定就行。除了Source Node、Target Node,其他列資料的屬性還包括Interaction Type、Edge Attribution、Source Attribution、Target Attribution 等,同時對應不同顔色和圖示标記。
指定好資料列之後,點選OK即可,資料導入到此為止,軟體會自動生成一個網絡圖。
頁面布局
Cytoscape是一個非常龐大的軟體,其功能非常豐富,頁面布局也比較複雜,在我們導入了網絡圖資料之後呢,它會直接幫我們生成一個網絡圖,其頁面如下:
由此可見,頁面相當複雜,而其中我們最常用的區域就是兩個:控制台和網絡圖區。控制台是我們用的最多的地方,這裡面至少包括了三個子面闆:
(1) Network: 網絡圖清單,這裡以樹形圖的方式羅列了我們打開的所有網絡圖
(2) Style: 外觀可視化控制台,這個面闆控制了我們的網絡圖外觀,所有的外觀設定都在這個裡面,這個面闆也包括了三個子面闆:
a) Node: 控制節點的外觀,包括大小、顔色、形狀等,使用頻率很高;
b) Edge: 控制連線的外觀,包括顔色、粗細等,使用頻率很高
c) Network: 控制網絡圖的外觀,如背景色等,使用較少;
(3) Select: 篩選,即從整個網絡圖當中按照使用者的要求去標明特Node或者Edge。這個功能用的也是比較多的。
整個Cytoscape頁面布局中最重要的就是控制台,而通過控制台中特定屬性的設定,我們就可以随心所欲地改變網絡圖的外觀了。
應用商店
Cytoscape的菜單欄中有很多的功能欄,而我唯獨要講一講這裡面的 Apps 這一欄。Apps 就像我們手機上面的應用商城一樣,提供了非常多的功能插件,它使得 Cytoscape 的功能根據使用者的需求無限延伸,而且最重要的是,這裡所有的插件都是免費的哦~,如下圖所示:
後續我們篩選關鍵基因、進行功能富集都是在這個裡面選取特定的插件實作的,是以Apps這個菜單欄也是極其重要的。
回到我們的研究課題當中,如何導入資料并實作進階的可視化操作呢?具體的步驟我這裡就不一一羅列了,大家可以看文末的視訊或者可以來參加我們近期的線下課程【線下·上海】實用生物資訊與資料挖掘系列課程,到時候會手把手一步步地教大家怎麼從一堆沒有頭緒的資料到一篇完整的SCI文章。
總之Cytoscape是一個非常龐大實用的軟體,它裡面隐藏了非常多的功能,建議大家有時間可以去閱讀一下Cytoscape的官方說明。
到這裡,我們的研究課題的三大步:
1、從基因清單到蛋白互作;(已完成)
2、從蛋白互作到互作網絡;(已完成)
3、從互作網絡到關鍵基因;
已經順利完成前面兩步了,下節教程我們講解第三個步驟,如何從蛋白互作的網絡鎖定關鍵基因。
本期幹貨
Cytoscape實操詳解
原文詳情:“科研貓”公衆号
科研貓原創系列,未經許可嚴禁轉載,版權事宜由上海辰明律師事務所提供法務支援。