什么叫可变对价,可变对价 或有对价
本文参考于生信技能树
切叶机可变剪切所需的材料是在RNA-seq过程中获得的bam文件。
首先是软件的安装:
1.源代码下载
git clone https://github.com/davidaknowles/leafcutter
#此命令下载软件的源代码。需要修改一个脚本scripts/bam2junc.sh来添加软件路径,并将软件路径添加到环境变量中。
2.软件安装:
因为软件是R包,所以可以直接在R: if(!require("devtools "))
install.packages("devtools ",repos= http://cran . us . r-project . org )
devtools:install _ github(" davidaknowles/leaf cutter/leaf cutter ")
或者,你可以使用康达安装:
conda install -y -c davidaknowles r-leafcutter
(我没有成功)正式过程
1.将bam文件转换为junc类型的文件:
*ls。bam bam_dir.txt #构建bam
cat bam_dir.txtwhile read id; do file=$(basename i d ) ; s a m p l e = id ); sample= id);sample={file%%.*}; echo Converting $id to $sample.junc; touch $sample.junc; sh bam2junc.sh $id $sample.junc; done
#的路径文件通过循环将bam文件转换为junc文件2.使用python脚本leafcutter_cluster.py进行内含子聚类
* ls.juncjuncjunc.txt # Build the构建junc的路径文件
conda creat python27 python=2.7
#使用conda构建下一步需要的2.7环境(现有的不行)conda activate python27
#切换到python2.7环境python /home/suly/biosoft/leafcutter/clustering/leafcutter_cluster.py -j junc.txt -m 50 -l 500000 -o testYRIvsEU
#这一步需要python 2.7环境才能完成。这一步完成后,你会得到以下文件,其中TestyrivSeu _ Perind _ Numbers.countries.gz比较重要。其中每行是一个内含子,每列是一个样本,表示它们的表达值。这些值可用于可变剪切分析。
numbers.countries.gz柏林含量:
zcat testYRIvsEU_perind_numers.counts.gztail
3.制作分组矩阵进行方差分析。
首先你需要构建如下图所示的分组文件group_info.txt。值得提醒的是,该文件有且只能有2个分组。
其次,外显子文件需要手工建立。
构建方法提取自基因组的注释gff文件,如下图所示:
cat model.gff3 grep exoncut -f1,4,5,7,9cut -d"." -f1exon.txt
#灵活使用cut和grep命令获取所需文件,如下图所示:leaf cutter _ ds . r-exon _ file=exon . txt-num _ threads 4-min _ samples _ per _ intron=3 testyrivseu _ periphery _ numbers . countries . gz group _ info . txt * #min _ samples _ per _ intron:
完成此步骤后,您将获得以下两个文件:
4.使用R脚本ds_plots可视化差异分析结果。稀有
ds_plots。r-e exon . txt testYRIvsEU _ perind _ numers . counts . gz group _ info . txt leaf cutter _ ds _ cluster _ significance . txt *
这一步完成后,将获得一个pdf图像,所有统计上显著的变量剪切形式将在该图像中可视化。
5.准备注释文件和可视数据
#您将获得一个名为testYRIvsEU的Rdata。如果文件没有后缀,可以自己添加。
6.可视化
leafcutter/leafviz/gtf2leafcutter.pl -o annotation …/ref/model.gff3
prepare_results.R -o testYRIvsEU.Rdata -m group_info.txt -f 0.05 -c testYRIvsEU testYRIvsEU_perind_numers.counts.gz leafcutter_ds_cluster_significance.txt leafcutter_ds_effect_sizes.txt annotation
#输入包含run_leafviz的目录。r并使用上一步中获得的Rdata文件。运行后会自动打开网页,在线可视化结果;关闭程序后,网页连接中断。