CIRI 识别circRNA_生信届小学生_新浪博客

新浪博客

加载中…

http://blog.sina.com.cn/u/6179256122

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

CIRI 识别circRNA

(2017-10-11 14:03:01)

CIRI 识别circRNA的原理

CIRI 根据circRNA 连接点处的reads来识别circRNA，在连接点处的reads 其比对情况非常特殊；

CIRI 根据3种模型来识别circRNA，连接点处的read 叫做junction read

A)

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420092909884-472316659.png识别circRNA" />

circRNA 由3个外显子环化形成，由于测序读长的限制，junction read 只覆盖了起始外显子和终止外显子的部分序列，这两部分reads的比对位置在基因组上的位置是相反的，

B）

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420093942743-1102311886.png识别circRNA" />

circRNA 由3个外显子环化形成，由于连接点处的一个外显子其长度太短，junction read 除了覆盖了起始外显子和终止外显子的两部分序列外，还覆盖了中间的一个外显子的部分序列

C)

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420094621790-469043973.png识别circRNA" />

circRNA 由1个外显子环化形成, junction read 除了覆盖了整个外显子外，还重复又读了一部分序列

D）

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420094718462-358290455.png识别circRNA" />

为了进一步降低假阳性率，CIRI 通过以下3条规则对结果进行过滤：

1）双端测序的两条reads 必须符合PEM 信号，以上面的示意图为例，进行说明

read1 是一条junction read, 来源于两个外显子，根据read1 的比对情况，确定了circRNA 在基因组上的位置，此时，如果这个circRNA 识别准确，那么read2 就肯定落在对应的位置内；

根据两条reads的比对情况，进一步过滤结果；

2）检测到的circRNA 的连接处符合AG-GT 剪切信号；

3）根据比对的质量和数量进行过滤，质量就是说mapping 的质量越高，识别的circRNA 越准确；数量就是说对于某个circRNA来说，检测到的juntion reads 越多，说明这个circRNA越可靠；

上面图中的几种模型只是帮助我们理解了exonic-circRNA的检测，其实对于non-exonic circRNA（包括intronic circRNA 和 intergenic circRNA)的检测，其原理是相似的，只是综合考虑了测序读长和连接点两段序列的长度，提出几种可能的比对模型，然后根据比对模型来检测对应的junction reads, 从而预测circRNA;

circRNA 结果的验证：
以一个预测得到的circRNA chr2: 58,311,224|58,316,858 为例，在基因组上的长度为 5634bp, 其连接点为VRK2基因的exon6和exon10

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420110027727-1035240000.png识别circRNA" />

理论上产生的circRNA的序列为所有外显子组成的序列，splicing length为407bp

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420110306352-675582331.png识别circRNA" />

为了验证该circRNA , 根据连接点两端的序列设计引物，扩增出该circRNA 片段，跑电泳，确定产物长度

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420112450212-231530334.png识别circRNA" />

图中的黑色片段为扩增产物的条带，根据PAGE 电泳的结果，确定其长度；然后进行一代测序，确定具体序列

http://images2015.cnblogs.com/blog/848402/201704/848402-20170420113214087-1015723059.png识别circRNA" />

参考文献：https://genomebiology.biomedcentral.com/articles/10.1186/s13059-014-0571-3

分析步骤：

#CIRI

bwa mem -t 16 -T 19 -v 2 /path/to/bwa_index /path/to/file1.fq /path/to/file2.fq >output.sam

perl CIRI_v1.2.pl -I output.sam -O /path/to/ciri/output.txt -F /path/to/genome.fa -P

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：环形RNA预测分析

后一篇：R的clusterprofiler包富集分析

新浪BLOG意见反馈留言板　欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

Copyright © 1996 - 2022 SINA Corporation, All Rights Reserved

新浪公司版权所有