加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

MG-RAST:快速注释宏基因组样品-生信-MEGAN5

(2015-11-10 05:56:00)
标签:

宏基因组

宏转录组

meta

高通量测序

数据挖掘

分类: sci攒人品ing
    作者:铁汉1990
    在julia的那篇metagenomic analysis of an anerobic alkane-degrading microbial culture文献中,最后数据提交到了IMG/M和MG-RAST上面进行注释。所以本着山寨的精神,想用这两个server练一下手。
    就我现在对生物信息的理解水平来说,我们所要做的工作无非就是拼接和比对。拼接就是将高通量测序的片段组合起来,比对是为了跟我们知道的序列信息找相同点,找找共性啊,搞搞系统进化,功能注释,序列分类,代谢功能重建。感觉很简单吧,但里面需要掌握两种脚本语言Peal和R语言,同是需要一些数学统计模型,比如说,马尔可夫模型,Bayesian模型,各种算法,以及各种变态的软件,各种数据的格式转换。哈哈,是不是比较有挑战。

      MG-RAST(metagenomics rapid annotation using subsystem technology)。这软件本事基于SEED框架构建的基因组比对的服务器,后来融入了很多其他的数据库,比如greengenes,RDP-II,European rRNA databases。所以后来,后来就是功能更强大,更人性化了嘛,不仅DNA,而且可以RNA,同时可以多个宏基因组比对分析,各种注释。上传的数据可以是454reads,可以是sanger sequences,可以是拼接后的数据,一般都是fasta格式。是不是感觉很棒。
      
MG-RAST(Metagenome Rapid Annotation using Subsystem Technology),是一个快速注释宏基因组样品的网页服务器。它可以分析序列片段的注释,他们的系统分类和初步的构建代谢途径。它也可以用来比较宏基因组数据的分类和初步代谢途径的构建。 (Reference: F. Meyer et al. 2008. BMC Bioinformatics 9: 386)。这个服务器刚开始是基于SEED数据的完整微生物基因的高质量注释而改进的。现在,大量其他的数据已经加入到了这个服务器,加强了微生物序列系统和功能的分类。比方说,greengenes,RDP-II 和European ribosomal RNA databases的加入使其能对宏基因组数据的16srRNA进行分类。

可以选择上传组装好的数据,但如果要进行多样品的比较,则需要上传原始的下机数据(组装好的数据没有丰度信息),MG-RAST 会按照质量值对原始数据进行过滤,在2.0版本中,MG-RAST 直接把 Reads(包括未组装的数据)和 SEED 蛋白数据库进行比对寻找同源蛋白,3.0 版本使用了适用于短序列基因预测的 FragGeneScan 先预测基因,然后再和多个数据库包括 SEED, KEGG, GO, INSDC, COGs, eggNOGs 等数据库进行比对。MG-RAST 的比对数据库中还包括有寻找线粒体等一些特殊的数据库。MG-RAST 另外的与众不同的地方是,提供了样品的背景信息,即 MetaData,可以供研究者在进行不同样品宏基因组比较时候提供参考。
作为持续更新的在线工具,即将推出的 MG-RAST 4.0 也会支持 reads 的组装。MG-RAST 的缺点也是明显的,首先对上传数据的大小和数量都有限制,数据量的增加导致分析时间也增加,此外,MG-RAST 提供的第三方分析工具太少,对分析方法没有更多的选择。

官网主页:http://metagenomics.anl.gov/ (如果你用的浏览器不是火狐的话,主页会给你提醒,为什么必须用火狐浏览器呢?)需要注册,注册后需要认证后方可上传数据,上传的数据你可以自己选择是公开还是不公开。 现在上传的数据支持fasta, fastq 和sff 格式。大于50M的可以以zip 或 gzip。上传的数据可以是粗略未组装的reads或组装好的contigs,如果上传的contig的平均长度超过40k,就应该考虑用RAST服务器来分析细菌或古菌的完整性。

   主页的HELP里面有详尽的使用说明

引用:
1,  MG-RAST http://evomics.org/learning/genomics/metagenomics/mg-rast/
2,  The metagenomics RAST server – a public resource for the automatic phylogenetic and functional analysis of metagenomes
3,MINT-基于 Linux 平台的宏基因组分析软件

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有