可变剪接,可变剪接的几种形式是什么,可变剪接,可变剪接的几种形式图片
00-
可变剪切可视化 rmats2sashimiplot
(python=2.7,康达更新康达)官网流程:https://github.com/Xinglab/rmats2sashimiplot(打开时打开VPN)
1、安装
:
可以用conda安装
conda install -c bioconda rmats2sashimiplot
安装好之后输入 rmats2sashimiplot -h
当帮助文档出现时,您可以使用它。
按照官网给的方法安装:
(1)本地下载安装包,解压,将解压后的文件拖到服务器上。
(2)安装依赖性:
conda install 安装即可
(3)转到rmats2sashimiplot-master的文件夹,安装rmats 2 sashimiplot for * * setup . py 77
的权限,执行
Python。/setup.pyinstall * *(4)输入**rmats2sashimiplot -h**会出现帮助文档,可以使用。
2、运行:
使用sam文件:
rmats2sashimiplot --s1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.sam,./rmats2sashimiplot_test_data/sample_1_replicate_2.sam,./rmats2sashimiplot_test_data/sample_1_replicate_3.sam --s2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.sam,./rmats2sashimiplot_test_data/sample_2_replicate_2.sam,./rmats2sashimiplot_test_data/sample_2_replicate_3.sam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_events_output
使用bam文件:
1、用-c坐标:
rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -c chr16:+:9000:25000:./rmats2sashimiplot_test_data/annotation.gff3 --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
1.bam文件是hisat2比较的bam文件。
2.对下面的文件进行排序,并用良好排序对bam文件进行索引。
3.排序后使用sort_bam文件可视化rmats2sashimiplot。
4.
-c
坐标后面的参考基因组注释文件为gff 3格式,与要使用的bam文件放在同一个目录下,即-c 染色体:起始:终止-1:正负链:./参考基因组注释文件
。5.这里的文件需要被可视化。MATS.JC.txt里面有几个内容,会生成几个图片,需要自己选择。选择时,尽量不要选择带NA的数值。
运行代码:
rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -c chr16:+:9000:25000:./annotation.gff3 -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
不带-c坐标:
rmats2sashimiplot --b1 ./sample1_sort.bam,./sample2_sort.bam,./sample3_sort.bam --b2 ./1_sort.bam,./2_sort.bam,./3_sort.bam -t SE -e /www/data/gaoshuang/cleanData/hisat2-bam/output_b8/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_coordinate_output
2.不带-c坐标:(输出图片和sam文件一样)
rmats2sashimiplot --b1 ./rmats2sashimiplot_test_data/sample_1_replicate_1.bam,./rmats2sashimiplot_test_data/sample_1_replicate_2.bam,./rmats2sashimiplot_test_data/sample_1_replicate_3.bam --b2 ./rmats2sashimiplot_test_data/sample_2_replicate_1.bam,./rmats2sashimiplot_test_data/sample_2_replicate_2.bam,./rmats2sashimiplot_test_data/sample_2_replicate_3.bam -t SE -e ./rmats2sashimiplot_test_data/SE.MATS.JC.txt --l1 SampleOne --l2 SampleTwo --exon_s 1 --intron_s 5 -o test_grouped_output
s:输入的文件格式为sam文件(参考组和对照组),每个sam文件前面都要带路径
b:输入的文件格式为bam文件(参考组和对照组),每个bam文件前面都要带路径
-t:输入的可变剪切事件的类型
-e:rmats定量输出的结果文件,如果-t是SE,则这部分输入的为SE.MATS.JC.txt 文件
l1,l2:输出的对照组和参考组对应的名字(可以自己起)
-o:输出的文件名称
根据sam文件输出结果的txt表应该可以查看
-c:染色体的座标 (染色体:正负链:开始:终止: + gff3格式的注释文件)
的坐标。使用过程中,libgfortran.so.1缺失,出现以下问题的解决方案:
解决方法:conda install libgfortran==1