系列文章目錄
資料挖掘—GEO,TCGA,Oncomine聯合資料(一)挖掘概述
前言
GEO線上工具:GEO2R
提示:以下是本篇文章正文内容,下面案例可供參考
一、GEO2R是什麼?
是GEO線上分析工具,基于此工具可以對部分GEO樣品資料進行基因差異表達分析。該工具主要針對晶片資料,借助R 及Limma包完成分析過程,使用者隻需要在網業上進行簡單的點選等手動操作即可獲得分析結果
二、使用步驟
1.對樣本資料的搜尋,這一過程在單細胞中已經講過,我們就跳過了
如果有不知道的,可以去單細胞的資料下載下傳中去檢視
2.使用GEO2R
2.使用GEO2R
代開你所需要的GSE侯是這樣的,
滑到最下面則是這樣的
看到下面的那個藍色的按鈕了嗎?就點他就好
點開之後這是對每個樣本的一些介紹,并且明确分開了兩個組的内容,要做差異分析必須要分組,是以按 一下上方的DEfine groups
就會出現這樣的一個小框,大家輸入normal然後點回車在輸入tumor,然後按住ctrl鍵将對應的樣本放入分組中,然後往下拉有一個按鈕,按下去就會将前250個最有顯著意義的基因篩選出來,
排列順序是按照p值排序的,為什麼按照p值排序大家可以去看我之前的文章。
然後大家看左邊每個ID旁邊都有一個小三角,按一下之後就會出現這個
看一看到每個樣本每個組之間的表達情況,logFC的值就是表達高的一方與表達低的一方的比值,以2為底。
大家再點這個按鈕
就可以得出樣本之間的資料
是這樣的 ,但是這樣的資料我們沒法用在後續的分析,是以我們需要處理,選擇你要使用的資料,打開excel将資料複制進一個表格中,是這樣的
然後選中第一列 ,然後在資料一欄中選擇分列
然後選擇固定寬度,根據實際需求選擇分組
分開之後,但是發現資料有一堆分号,是以我們是用替換功能将分号替換為空格就好了,然後自己手動修改表頭列名就好
然後大家做可視化的時候可以在這完成,大家看下圖各種各樣的可視化的圖都有,
可以根據自己的實際需要使用可視化圖
适用範圍:
點選這個Full instructions就會出現适用範圍
大緻範圍是:GEO2R是一種互動式網絡工具,允許使用者比較 GEO 系列中的兩組或更多組樣本,以識别在不同實驗條件下差異表達的基因。結果顯示為按顯着性排序的基因表和圖形集合,以幫助可視化差異表達的基因并評估資料集品質。與 GEO 的其他資料集分析工具不同,GEO2R 不依賴于策劃的資料集,而是直接查詢原始系列矩陣資料檔案。這允許及時分析更大比例的 GEO 資料。然而,重要的是要意識到該工具幾乎可以通路和分析任何 GEO 系列,無論資料類型和品質如何,是以使用者必須了解 GEO2R限制和注意事項。
總結
本章主要是講解了GEO的線上工具,如果隻是自己用于實驗的話,這個線上工具能解決很多需求,它的可視化友善了很多非生信的使用者。
下一章我會講解(三)GEO資料的下載下傳和資料品質分析
最後我所做的所有分析與教程的代碼都會在我的個人公衆号中,請打開微信搜尋“生信學徒”進行關注,歡迎生信的研究人員和同學前來讨論分析。
ps:公衆号剛剛建立比較簡陋,但是該有的内容都不會少。圖檔有的很模糊,主要是因為我用的qq截圖然後想直接放到文章裡來,結果他不讓,我隻能放到桌面,在從桌面拖進來,像素就越來越低,生氣!