EMBOSS 工具使用总结

标签:
教育 |
分类: 生物信息 |
EMBOSS 是"The European Molecular Biology Open Software
Suite"的缩写,是一个开放源代码的序列分析软件包,它是一组为分子生物学家所设计的公开且免费软件。该软件能够自动识别处理以不同格式存储的数据,甚至可以通过互联网提取数据,此外同软件包一同提供的还包括大量的程序库,软件包整合了
100多个的序列分析程序,可以满足一般实验室的各种各样的序列分析要求。并且,因为该软件包同时提供了一个扩展库,它也是允许其他科学家依据自由软件精神编制、发布软件的一个平台。EMBOSS
同时将现在可以得到的一系列序列分析工具整合成一个无缝的整体。
使用者可以通过三种不同的方式使用 EMBOSS 软件:第一种是通过命令行的方式;第二种是通过 X-Windows 的方式使用
EMBOSS 软件的图形界面;第三种是内联网的方式。使用者可以免费获得以及这些软件以及相关界面程序。
通过前几节课的学习,我们已经学习了
water、needle、dottup、dotmatcher、dotpath、polydot、pepwheel、pepnet、tmap
等多种 EMBOSS 软件包中的工具,下面就对这几个工具的使用作一个简要的总结。
首先 water、needle、dottup、dotmatcher、dotpath、polydot 属于序列排比分析(Sequence
Alignment)工具,上次已经做过总结,这次再简要谈一下。dotplot是以点阵图来分析序列的相似性,能够在全局直观的反映两条或多条序列的相似程度。needle
和 water 程序则是用来精确排比分析两条序列相似程度,计算得分、一致性及相似性。在 dotplot 中,dottup
是两条序列精确匹配的作图方法,这个程序的执行方式是在给定序列长度(word size) 下逐一比对,找到完全相同的序列片段。而
dotmatcher 是两条序列近似匹配的作图方法,并不像 dottup 那样要求特定长度的序列完全相同,它的执行方式是通过设定
threshold 来图示序列的相似度,只要在给定的 window size
内,各碱基或氨基酸的配对得分高于设定的threshold,便可以在图示中表现出来。Dotpath 是 Non-overlapping
wordmatch dotplot of two sequence,即两条序列不重叠的逐个匹配的作图方法。它与 dottup
类似,但是排除了重叠的情况,序列不再进行重复的排比。最后一个 Polydot 则是display all-against-all
dotplots of a set of
sequence,是一个多个序列比对的作图工具。用它可以进行多个序列两两之间的排比分析。
needle是用来寻找两条序列整体的最相似的区域 (global
alignment);而water则是用来寻找两段序列间最为匹配的区域(local alignment)
。needle是将两条序列从头到尾完全并列的分析,即使序列长度不一致,也会在两端补上大段的gap,并计算在得分和相似性之内;water则只列出中间最相似的区域两条序列,其余两端不匹配的片断略去不列出来,适合在较长的序列中找到相似性较高的片断。
Needle、water程序可以和dotplot结合起来使用,对于实验中获得的序列,我们可以先用dotplot进行整体上的分析,找出相似区域,然后以needle或water进行进一步的排比分析。同时,dotplot也可以比较cDNA和genomic
sequence,用来判断exon在genomic sequence中的位置。
上节课学习的tmap、pepwheel、pepnet属于蛋白质二级结构分析工具,由于在本地通过命令行方式运行程序不需要依赖网络条件,所以我在Fedore
core3系统下安装了EMBOSS软件包进行了练习。
tmap用来查看该蛋白是否具有跨膜区,我用我们实验室做的Ralstonia solanacearum
GMI1000的aac基因表达的蛋白质做材料,建立序列文件命名为gmi1000,FASTA格式,用tmap明令查看它的跨膜区域,在终端下输入:
[valentine@localhost aac]$ tmap gmi1000 gmi1000.tmap -graph png -go
gmi1000
显示 Displays membrane spanning regions
Created gmi1000.1.png
查看图形 [valentine@localhost aac]$ display gmi1000.1.png
http://www.bbioo.com/bio101/UploadFiles/200712/20071211201447631.gif工具使用总结" TITLE="EMBOSS