项目目的
CIRI2和CIRCexplore,2联合使用对数据进行circRNAs鉴定,并进一步做下游的差异表达等分析。
项目流程
1·tophat,BWA用于map到参考基因组。
2·CIRCexplorer2,CIRI2 用于circRNA的鉴定。
3·DESeq2用于差异表达分析
4·BlastN 用于比较在线数据库(circbase)上的信息以获得保守或者新鉴定circRNA
5·Targetscans 用于miRNA靶位点的预测。
6·Blast2go 用于GO富集分析
参考文章
circRNA_茶树叶片
circRNA学习专题 – circRNA数据获得方式的讨论
CircTest
具体流程实现
使用CIRI2鉴定circRNA
#!/bin/sh
work_path=$(echo "/home/zhou/RNASEQ/CircularRNA-seq/rawdata/")
cd $work_path
sampledir=($(ls -d Sample*/))
#echo ${array[@]}
for ((i=0;i<${#sampledir[@]};i++))
do
#进入对应样本的目录
cd $work_path
cd ${sampledir[$i]}
#获取文件名
fastpinput1=$(ls *R1*fastq.gz)
fastpinput2=$(ls *R2*fastq.gz)
#echo $fastpinput1
#echo $fastpinput2
fastpoutput1=$(ls *R1*fastq.gz|sed 's/\.fastq\.gz/\_fastpedited\.fastq/g')
fastpoutput2=$(ls *R2*fastq.gz|sed 's/\.fastq\.gz/\_fastpedited\.fastq/g')
#echo $fastpoutput1
#echo $fastpoutput2
#fastp预处理
fastp -w 16 --dont_overwrite -i $fastpinput1 -I $fastpinput2 -o $fastpoutput1 -O $fastpoutput2
#bwa mem 比对
index=$(echo "/home/zhou/RNASEQ/index/hg19.fa")
gtf_anno=$(echo "/home/zhou/RNASEQ/index/hg19.gtf")
outdir=$(echo "ciri_output")
#echo $index
#echo $outdir
if [[ ! -d "$outdir" ]]; then
mkdir ${outdir}
fi
rm ${outdir}/*
name=$(echo ${fastpoutput1}|sed 's/\_[ACTG]*\_.*\.fastq//g')
samplename=$(echo ${name}|sed 's/\/.*\///g')
bwasamfile=$(echo "${outdir}/${samplename}.sam")
echo $samplename
SHELL_FOLDER=$(cd "$(dirname "$0")";pwd)
#echo $SHELL_FOLDER
bwa mem -T 19 -t 24 $index $fastpoutput1 $fastpoutput2 > $bwasamfile
ciripath=$(echo "/home/zhou/Software/CIRI-full_v2.0/bin/CIRI_v2.0.6/CIRI2.pl")
cirioutfile=$(echo "${outdir}/${samplename}.ciri")
perl $ciripath -I $bwasamfile -O $cirioutfile -F $index -A $gtf_anno -T 20
done
对每个样本的ciri结果文件进行合并
把ciri结果文件全部复制到一个文件夹下,然后通过脚本CircTest/merge_ciri.py把junction_reads.txt,non_junction_reads.txt 和 junction_reads_ratio.txt合并出来
#!/bin/sh
mergedir="CIRI2_merge"
if [[ ! -d "$mergedir" ]]; then
mkdir $mergedir
fi
find ./ -name *ciri|xargs -n1 -i cp {} ./${mergedir}/
git clone https://github.com/dieterich-lab/CircTest.git
cp CircTest/merge_ciri.py ./${mergedir}/
python ./${mergedir}/merge_ciri.py ~/RNASEQ/CircularRNA-seq/rawdata/CIRI2_merge/