CIRI 识别circRNA

CIRI 识别circRNA的原理
CIRI 根据3种模型来识别circRNA, 连接点处的read 叫做junction read
A)
http://images2015.cnblogs.com/blog/848402/201704/848402-20170420092909884-472316659.png识别circRNA" />
circRNA 由3个外显子环化形成, 由于测序读长的限制,junction read 只覆盖了起始外显子和终止外显子的部分序列,这两部分reads的比对位置在基因组上的位置是相反的,
B)
http://images2015.cnblogs.com/blog/848402/201704/848402-20170420093942743-1102311886.png识别circRNA" />
circRNA 由3个外显子环化形成, 由于连接点处的一个外显子其长度太短,junction read 除了覆盖了起始外显子和终止外显子的两部分序列外,还覆盖了中间的一个外显子的部分序列
C)
http://images2015.cnblogs.com/blog/848402/201704/848402-20170420094621790-469043973.png识别circRNA" />
circRNA 由1个外显子环化形成, junction read 除了覆盖了整个外显子外,还重复又读了一部分序列
D)
http://images2015.cnblogs.com/blog/848402/201704/848402-20170420094718462-358290455.png识别circRNA" />
为了进一步降低假阳性率,CIRI 通过以下3条规则对结果进行过滤:
1)双端测序的两条reads 必须符合PEM 信号,以上面的示意图为例,进行说明
read1 是一条junction read, 来源于两个外显子,根据read1 的比对情况,确定了circRNA 在基因组上的位置,此时,如果这个circRNA 识别准确,那么read2 就肯定落在对应的位置内;
根据两条reads的比对情况,进一步过滤结果;
2) 检测到的circRNA 的连接处符合AG-GT 剪切信号;
3)根据比对的质量和数量进行过滤,质量就是说mapping 的质量越高,识别的circRNA 越准确;数量就是说对于某个circRNA来说,检测到的juntion reads 越多,说明这个circRNA越可靠;
上面图中的几种模型只是帮助我们理解了exonic-circRNA的检测,其实对于non-exonic
circRNA(包括intronic
circRNA 结果的验证:
以一个预测得到的circRNA
http://images2015.cnblogs.com/blog/848402/201704/848402-20170420110306352-675582331.png识别circRNA" />
为了验证该circRNA , 根据连接点两端的序列设计引物,扩增出该circRNA 片段,跑电泳,确定产物长度
http://images2015.cnblogs.com/blog/848402/201704/848402-20170420112450212-231530334.png识别circRNA" />
图中的黑色片段为扩增产物的条带,根据PAGE 电泳的结果,确定其长度;然后进行一代测序,确定具体序列
http://images2015.cnblogs.com/blog/848402/201704/848402-20170420113214087-1015723059.png识别circRNA" />
分析步骤:
#CIRI
bwa mem -t 16 -T 19 -v 2 /path/to/bwa_index /path/to/file1.fq /path/to/file2.fq >output.sam
perl CIRI_v1.2.pl -I output.sam -O /path/to/ciri/output.txt -F /path/to/genome.fa -P