可變剪切可視化 rmats2sashimiplot (python=2.7,conda update conda)
官網流程:
https://github.com/Xinglab/rmats2sashimiplot(打開的時候開VPN)
1、安裝:
可以用conda安裝
conda install -c bioconda rmats2sashimiplot
安裝好之後輸入
rmats2sashimiplot -h
出現幫助文檔即可以使用
按照官網給的方法安裝:
(1)下載下傳安裝包到本地,并解壓好,将解壓好的檔案拖到伺服器中
(2)安裝依賴:
conda install 安裝即可
(3)進入到rmats2sashimiplot-master的檔案夾裡,給**
setup.py 777
的權限,執行
python ./setup.py install
** 安裝rmats2sashimiplot
(4)輸入**
rmats2sashimiplot -h
** 出現幫助文檔,即可使用
2、運作:
用sam檔案:
rmats2sashimiplot --s1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.sam,./rmats2sashimiplot_test_data/sample_1_replicate_2.sam,./rmats2sashimiplot_test_data/sample_1_replicate_3.sam --s2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.sam,./rmats2sashimiplot_test_data/sample_2_replicate_2.sam,./rmats2sashimiplot_test_data/sample_2_replicate_3.sam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_events_output
用bam檔案:
1、帶 -c 坐标的:
rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -c chr16:+:9000:25000:./rmats2sashimiplot_test_data/annotation.gff3 --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
1、bam檔案為hisat2 比對得出的bam檔案
2、給檔案sort以下,并給sort好的bam檔案建索引
3、使用sort之後的sort_bam檔案,進行rmats2sashimiplot 可視化
4、-c 座标後面的參考基因組注釋檔案用 gff 3格式,并且和所要用的bam檔案放在同一個目錄下,即
-c 染色體:起始:終止-1:正負鍊:./參考基因組注釋檔案
5、這裡的需要可視化SE.MATS.JC.txt的文檔,裡面有幾條内容,就會生成幾個圖檔,是以需要自己去挑選一下,挑選的時候,盡量不要選存在 NA 的值。
運作代碼:
rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -c chr16:+:9000:25000:./annotation.gff3 -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
不帶-c座标:
rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
2、不帶 -c 坐标的:(輸出的圖檔同sam檔案)
rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_grouped_output
–s:輸入的檔案格式為sam檔案(參考組和對照組),每個sam檔案前面都要帶路徑
–b:輸入的檔案格式為bam檔案(參考組和對照組),每個bam檔案前面都要帶路徑
-t:輸入的可變剪切事件的類型
-e:rmats定量輸出的結果檔案,如果-t是SE,則這部分輸入的為SE.MATS.JC.txt 檔案
–l1,–l2:輸出的對照組和參考組對應的名字(可以自己起)
-o:輸出的檔案名稱
-c:染色體的座标 (染色體:正負鍊:開始:終止: + gff3格式的注釋檔案) 這個座标應該可以根據sam檔案輸出的結果txt表格中,去檢視
使用過程中,缺少
libgfortran.so.1
,出現以下問題的解決方法:
解決方法:
conda install libgfortran==1
可視化的檔案在plot的檔案裡,為pdf