Bowtie的原理
(2014-09-16 19:43:11)
标签:
bowtie |
分类: biology |
我一直以为Bowtie是一个短序列拼接工作,实际上这是错误的。它不是序列拼接工作,只是一个序列比对的工具。最后的结果是相对index而言,对各个短序列进行定位。
答:序列比对(alignment):为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。跟长序列比对不同,短序列比对有其特点,因此,两者的算法不一样。短序列比对中,一般常用的算法主要有三个:
(1)
空位种子片段索引法,如MAQ、ELAND等,首先将读段切分,并选取其中一段或几段作为种子建立搜索索引,再通过查找索引、延展匹配来实现读段定位,通过轮换种子考虑允许出现错配(mismatch)的各种可能的位置组合;
(2) Burrows
Wheeler转换法,如Bowtie、BWA、SOAP2等,通过B-W转换将基因组序列按一定规则压缩并建立索引,再通过查找和回溯来定位读段,在查找时可通过碱基替代来实现允许的错配;
(3)
Smith-Waterman动态规划算法,如BFAST,SHRiMP等,利用初始条件和迭代关系式计算两个序列的所有可能的比对分值,并将结果存放于一个矩阵中,利用动态规划的方法回溯寻找最优的比对结果。
------------------
短序列比对的原理如何?目前有哪些常用的短序列比对软件? ok
http://blog.sina.com.cn/s/blog_9617895f01011npk.html
华大基因拼接 ok
http://www.ebiotrade.com/newsf/2010-1/2010128171022809.htm
下一代基因序列拼接算法研究
http://www.fdurop.fudan.edu.cn/upload/stu/docs/rcYsXb_102804-1303180458.pdf
基因组测序及分析 Good!推荐看!
http://ibi.zju.edu.cn/bioinplant/courses/chap4.pdf
基因序列拼接算法设计
http://www.doc88.com/p-741680604744.html