可变剪切可视化 rmats2sashimiplot (python=2.7,conda update conda)
官网流程:
https://github.com/Xinglab/rmats2sashimiplot(打开的时候开VPN)
1、安装:
可以用conda安装
conda install -c bioconda rmats2sashimiplot
安装好之后输入
rmats2sashimiplot -h
出现帮助文档即可以使用
按照官网给的方法安装:
(1)下载安装包到本地,并解压好,将解压好的文件拖到服务器中
(2)安装依赖:
conda install 安装即可
(3)进入到rmats2sashimiplot-master的文件夹里,给**
setup.py 777
的权限,执行
python ./setup.py install
** 安装rmats2sashimiplot
(4)输入**
rmats2sashimiplot -h
** 出现帮助文档,即可使用
2、运行:
用sam文件:
rmats2sashimiplot --s1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.sam,./rmats2sashimiplot_test_data/sample_1_replicate_2.sam,./rmats2sashimiplot_test_data/sample_1_replicate_3.sam --s2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.sam,./rmats2sashimiplot_test_data/sample_2_replicate_2.sam,./rmats2sashimiplot_test_data/sample_2_replicate_3.sam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_events_output
用bam文件:
1、带 -c 坐标的:
rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -c chr16:+:9000:25000:./rmats2sashimiplot_test_data/annotation.gff3 --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
1、bam文件为hisat2 比对得出的bam文件
2、给文件sort以下,并给sort好的bam文件建索引
3、使用sort之后的sort_bam文件,进行rmats2sashimiplot 可视化
4、-c 座标后面的参考基因组注释文件用 gff 3格式,并且和所要用的bam文件放在同一个目录下,即
-c 染色体:起始:终止-1:正负链:./参考基因组注释文件
5、这里的需要可视化SE.MATS.JC.txt的文档,里面有几条内容,就会生成几个图片,所以需要自己去挑选一下,挑选的时候,尽量不要选存在 NA 的值。
运行代码:
rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -c chr16:+:9000:25000:./annotation.gff3 -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
不带-c座标:
rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
2、不带 -c 坐标的:(输出的图片同sam文件)
rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_grouped_output
–s:输入的文件格式为sam文件(参考组和对照组),每个sam文件前面都要带路径
–b:输入的文件格式为bam文件(参考组和对照组),每个bam文件前面都要带路径
-t:输入的可变剪切事件的类型
-e:rmats定量输出的结果文件,如果-t是SE,则这部分输入的为SE.MATS.JC.txt 文件
–l1,–l2:输出的对照组和参考组对应的名字(可以自己起)
-o:输出的文件名称
-c:染色体的座标 (染色体:正负链:开始:终止: + gff3格式的注释文件) 这个座标应该可以根据sam文件输出的结果txt表格中,去查看
使用过程中,缺少
libgfortran.so.1
,出现以下问题的解决方法:
解决方法:
conda install libgfortran==1
可视化的文件在plot的文件里,为pdf