加载中…
16s测序分析
16S测序分析
个人资料
宁生信
宁生信
  • 博客等级:
  • 博客积分:0
  • 博客访问:65,648
  • 关注人气:27
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
访客
加载中…
好友
加载中…
评论
加载中…
留言
加载中…
博文
标签:

linux

分类: 生物信息学




 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
利用在线工具绘制:
摘要
基因组研究过程中,基因家族聚类分析是一个比较重要的内容。基因家族聚类过程中通常会用venn图来展示聚类的情况。
R语言或者其他的画图语言都可以本地实现venn图的绘制,但是有一个venn图的在线绘制工具,大家知道吗?
操作步骤
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
1、R语言手动绘制
安装加载所需R包
install.packages('VennDiagram')
library(VennDiagram)
setwd('D:/venn')
venn1<- venn.diagram(list(A = 1:10, B = 5:15),'venn1')    ##图片保存在指定文件夹中
同理可画出更多集合的韦恩图,通常情况下最多绘制五个集合的韦恩图
venn2<- venn.diagram(list(A = 1:150, B = 121:170,C=75:234,D=23:190),filename=NULL)    
grid.draw(venn2)   ##图片显示在屏幕上
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
对菌群16S rRNA基因进行高通量测序,无疑是微生物组研究中最基础也是最常用的研究方法,能以较高的性价比揭示菌群的具体物种组成,从而解答“群落中有谁在?”的基本问题。然而,很多时候,我们更希望知道菌群行使的具体功能,也就是解释“它们在干什么?”。对菌群进行宏基因组测序自然是最佳解决方案,但如此高大上的研究方法,投入成本相对较多,分析方法也相对复杂。如果仅仅知道菌群组成,该怎么把物种的“身份”和它的“功能”对应起来呢?
由此,一款名为PICRUSt的菌群代谢功能预测利器应运而生,相关论文发表在权威期刊《Nature Biotechnology》上[1]。
PICRUSt全称为“Phylogenetic Investigation of Communities byReconstruction of Unobserved States”,可以通过16S rRNA基因序列,预测对应的细菌和古菌的代谢功能谱。

有了PICRUSt,相当于在菌群的“组成”和“功能”之间搭起了一座桥,即使只有16S rRNA基因的测序结果,我们一样可以获得宏基因组级别的研究结果!

1、PICRUSt的基本原理
PICRUSt的总体思路说来很简单,主要分为3步:
1. 先根据已
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2017-07-31 11:04)
文章名字:SURVEY AND SUMMARY
Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists
曾经的基因的功能研究,往往都是一两个基因,这样研究较为简单。随着测序技术的发展,各种组学的突飞猛进,目前功能基因的研究数量较多。大量功能基因的研究成为挑战,很多的富集分析的软件被开发出来大概可以分为三类,大约一共有68个生信富集分析的工具。由于工具较多,对于研究者来说对理解每个软件的算法和优缺点比较困难,因此书写这篇文章目的在于帮助研究者能够根据自己的问题选择最为合适的生信富集分析工具。

高通量测序时代,使得对全基因组范围内的基因进行整体研究分析成为可能,这样会产生大量的感兴趣的基因。从感兴趣的基因组筛选有意义的基因也成为一件挑战和令人沮丧的事情。好在GO数据库和其他一些富集分析的软件出现,02年到03年间DAVID、EASE等软件出现、05年14个类似的软件出现,到现在大约一共有68个富集分析的软件。
目前对于研究者而言因为富集分析没有统一的方法、也没有黄金标准,因此存在以下几点问题。
对已有
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

生物信息学

install.packages(“qqman”)  # 安装包
library(“qqman”)  #加载包
data(package=“qqman”)  # 查看qqman包中的测试数据,此包中包含gwasResults snpsOfInterest 两个测试数据
View(gwasResults)  #查看 gwasResult的数据格式
head(snpsOfInterest)#查看 snpsOfInterest的数据格式
1.数据格式。
文件命名为gwasResults

表头依次是SNP(snp名称,字符型,命名时以“rs”开头),CHR(染色体编号,整型),BP(碱基位置,整型),P(数值型)
参数:

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

生物信息学

Metagenome测序平台,主流illumina





测序前处理:
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

生物信息学

PICRUSt可以通过16s测序获得的物种构成推测样本中的功能基因的构成, 从而分析不同样本和分组之间在功能上的差异。通过对宏基因组测序数据功能分析和对应16s预测功能分析结果的比较发现, 此方法的准确性在84%-95%, 对肠道微生物菌群和土壤菌群的功能分析接近95%, 能非常好的反映样品中的功能基因构成。 
 PICRUSt分析过程
对原始16s测序数据的种属数量进行标准化, 因为不同的种属菌包含的16s拷贝数不相同。然后将16s的种属构成信息通过构建好的已测序基因组的种属功能基因构成表映射获得预测的功能结果。
PICRUSt推测宏基因组metagenome准确性:
样品中的OTU与已知微生物越相近,预测准确度越高。
人体微生物群落(肠道、皮肤等)由于测序数据丰富,PICRUSt的功能预测准确度可达85%左右。
对环境样品的预测准确度较低。
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
UnsatisfiableError:
The following specifications were found to be in conflict:
- mayavi -> apptools 4.2.0 -> python 2.7*
- python 3.6*
Use 'conda info ' to see the dependencies for each package.



(D:\anaconda3) C:\Users\lilizi>cd ../

(D:\anaconda3) C:\Users>cd ../
anaconda安装.whl的方法:
CD 文件存储路径            #进入你放.whl文件的地方
pip install 文件名.whl    #安装文件
pip list                          #用来查看是不是安装好了
以上


(D:\anaconda3) C:\>cd tvtk

(D:\anaconda3) C:\tvtk>pip install PyQt5-5.8.2-5.8.0-cp35.cp36.cp37-none-win_amd64.whl
Processing c:\tvtk\p
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
(2017-06-27 21:33)
标签:

生物信息学

分类: 生物信息学

受试者工作特征曲线(ROC曲线,receiver operator characteristic curve),最初作为一种分析方法在二战时用于评价雷达性能(

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有