加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

使用lefse与metastats寻找宏基因组数据中的biomarker

(2015-08-06 14:01:06)
分类: 微生物

1:lefse在线分析网址:http://huttenhower.sph.harvard.edu/galaxy(建议使用在线分析)

          http://huttenhower.sph.harvard.edu/lefse/

   metastats分析网址:http://metastats.cbcb.umd.edu


2:以上两个软件都都可以实现在线和本地化分析。metastats软件只能进行两个分组比较,lefse则可以实现多个分组之间同时比较,而且还设计到分组比较的内部进行亚组分析比较。更加准确,精度更高,推荐使用。


3:文献:

2011-Metagenomic biomarker discovery and explanation(http://www.genomebiology.com/content/12/6/R60)


4:简单原理介绍:linear discriminant analysis (LDA) effect size (LEfSe)

使用lefse与metastats寻找宏基因组数据中的biomarker
输入:矩阵文件可以是16s OTU 可以基因表达数据
每一行代表一个物种(OTU或gene_iD ,每一列为一个样本)

step1:先进行两组之间比较,或者多组之间两两比较选出差异的待选marker(统计方法:)

step2:分别比较两组之内的亚组进行差异比较,同样存在差异一致性定义为最终marker
使用lefse与metastats寻找宏基因组数据中的biomarker

5:分析可以分为严格和不严格,严格是指所有分类两两比较都有差异,不严格是指只要有两个分类有差异就把这个分类挑选出来


6:目前可以将qiime的输出结果biom格式的文件加上fastmap.txt文件作为输入就可以得到微生物的分类信息,这样的程序已经被牛人写成python,大家可以在https://github.com/twbattaglia/koeken,以及https://pypi.python.org/pypi/pannenkoek/0.1.5以上两个程序都可以


7:需要说明一点两个程序都涉及到一个参数spl,这个参数必须有,你可以在fastmap.txt文件中设置一个分组例如:Data 后面分组到信息都一样就可以了比如都写成数字2016,实际貌似这是个取样时间都参数




0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有