R的clusterprofiler包富集分析

R的clusterprofiler包做功能富集分析
clusterProfiler是Bioconductor的软件包,可以对基因集合或基因cluster进行功能聚类的统计分析和可视化。下载说明文档及安装包的地址为:
http://bioconductor.org/packages/release/bioc/html/clusterProfiler.html
clusterProfiler功能有以下几个方面:
功能富集分析
富集结果可视化
一、功能富集分析
1.GO富集分析
具体方法为:
enrichGO <- enrichGO(gene = gene, universe =
names(geneList),organism = “human”, ont = “CC”, pvalueCutoff =
0.01, readable= TRUE)
该函数以geneList作为背景基因集,pvalue=0.01做为阈值,在GO
的CC分类上对基因集合进行富集分析。结果如下:
http://image.sciencenet.cn/album/201604/19/193537pgcbdhzh1ifbhjg5.png
2.KEGG富集分析
所用函数为:
enrichKEGG <- enrichKEGG(gene = gene,organism
=
该函数将基因集合以0.01为阈值进行KEGG的通路富集。结果如下:
http://image.sciencenet.cn/album/201604/19/19372798pxh9lus99n9pa3.png
另外,还可以对基因集合做DO(disease
ontology)及Reactome
pathway富集分析。具体函数可参加说明文档。
二、富集结果可视化
1 可以对KEGG的通路可视化(以通路hsa04110为例,具体方法为:)
require(pathview)
Hsa04110 <- pathview( gene.data = geneList, pathway.id
=
可视化结果如下图:
http://image.sciencenet.cn/album/201604/19/194046x3btjmvosy0mva0m.png
2 对GO富集的结果可视化
具体方法为:
Barplot(ggo,drop=TRUE,showCategory = 12)
结果输出的是ggo富集记过中前12位的条目,如下图:
http://image.sciencenet.cn/album/201604/19/194249uyq0p1110byg2pjr.png
比较基因集合的生物学功能
利用compareCluster函数,可以自动计算每个基因集所富集的功能分类。具体方法为:
Compare <- compareCluster(geneCluster=geneset, fun=”enrichKEGG”)
Plot(Compare)
http://image.sciencenet.cn/album/201604/19/194435vddknc7z0henmdkd.png