MG-RAST:快速注释宏基因组样品-生信-MEGAN5

标签:
宏基因组宏转录组meta高通量测序数据挖掘 |
分类: sci攒人品ing |
MG-RAST(Metagenome Rapid
Annotation using Subsystem
Technology),是一个快速注释宏基因组样品的网页服务器。它可以分析序列片段的注释,他们的系统分类和初步的构建代谢途径。它也可以用来比较宏基因组数据的分类和初步代谢途径的构建。
(Reference: F. Meyer et al. 2008. BMC Bioinformatics 9:
386)。这个服务器刚开始是基于SEED数据的完整微生物基因的高质量注释而改进的。现在,大量其他的数据已经加入到了这个服务器,加强了微生物序列系统和功能的分类。比方说,greengenes,RDP-II
和European ribosomal RNA
databases的加入使其能对宏基因组数据的16srRNA进行分类。
可以选择上传组装好的数据,但如果要进行多样品的比较,则需要上传原始的下机数据(组装好的数据没有丰度信息),MG-RAST
会按照质量值对原始数据进行过滤,在2.0版本中,MG-RAST 直接把 Reads(包括未组装的数据)和 SEED
蛋白数据库进行比对寻找同源蛋白,3.0 版本使用了适用于短序列基因预测的 FragGeneScan 先预测基因,然后再和多个数据库包括
SEED, KEGG, GO, INSDC, COGs, eggNOGs 等数据库进行比对。MG-RAST
的比对数据库中还包括有寻找线粒体等一些特殊的数据库。MG-RAST 另外的与众不同的地方是,提供了样品的背景信息,即
MetaData,可以供研究者在进行不同样品宏基因组比较时候提供参考。
作为持续更新的在线工具,即将推出的 MG-RAST 4.0
也会支持 reads 的组装。MG-RAST
的缺点也是明显的,首先对上传数据的大小和数量都有限制,数据量的增加导致分析时间也增加,此外,MG-RAST
提供的第三方分析工具太少,对分析方法没有更多的选择。
官网主页:http://metagenomics.anl.gov/
(如果你用的浏览器不是火狐的话,主页会给你提醒,为什么必须用火狐浏览器呢?)需要注册,注册后需要认证后方可上传数据,上传的数据你可以自己选择是公开还是不公开。
现在上传的数据支持fasta, fastq 和sff 格式。大于50M的可以以zip 或
gzip。上传的数据可以是粗略未组装的reads或组装好的contigs,如果上传的contig的平均长度超过40k,就应该考虑用RAST服务器来分析细菌或古菌的完整性。
引用:
1, MG-RAST
http://evomics.org/learning/genomics/metagenomics/mg-rast/
2, The
metagenomics RAST server – a public resource for
the automatic phylogenetic and functional analysis of
metagenomes
3,MINT-基于 Linux
平台的宏基因组分析软件