加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

R的clusterprofiler包富集分析

(2017-10-11 16:09:50)

R的clusterprofiler包做功能富集分析

clusterProfiler是Bioconductor的软件包,可以对基因集合或基因cluster进行功能聚类的统计分析和可视化。下载说明文档及安装包的地址为:

http://bioconductor.org/packages/release/bioc/html/clusterProfiler.html

clusterProfiler功能有以下几个方面:

功能富集分析

富集结果可视化


一、功能富集分析

1.GO富集分析

具体方法为:

enrichGO <- enrichGO(gene = gene, universe = names(geneList),organism = “human”, ont = “CC”, pvalueCutoff = 0.01, readable= TRUE)

该函数以geneList作为背景基因集,pvalue=0.01做为阈值,在GO 的CC分类上对基因集合进行富集分析。结果如下:

http://image.sciencenet.cn/album/201604/19/193537pgcbdhzh1ifbhjg5.png

2.KEGG富集分析

所用函数为:

enrichKEGG <- enrichKEGG(gene = gene,organism = human, pvalueCutoff = 0.01, readable= TRUE)

该函数将基因集合以0.01为阈值进行KEGG的通路富集。结果如下:

http://image.sciencenet.cn/album/201604/19/19372798pxh9lus99n9pa3.png

另外,还可以对基因集合做DO(disease ontology)及Reactome pathway富集分析。具体函数可参加说明文档。

二、富集结果可视化

1 可以对KEGG的通路可视化以通路hsa04110为例,具体方法为:

require(pathview)

Hsa04110 <- pathview( gene.data = geneList, pathway.id = hsa04110, species=hsa, limit=list(gene = max(abs(geneList))),cpd=1)

可视化结果如下图:

http://image.sciencenet.cn/album/201604/19/194046x3btjmvosy0mva0m.png

2 对GO富集的结果可视化

具体方法为:

Barplot(ggo,drop=TRUE,showCategory = 12)

结果输出的是ggo富集记过中前12位的条目,如下图:

http://image.sciencenet.cn/album/201604/19/194249uyq0p1110byg2pjr.png

比较基因集合的生物学功能

利用compareCluster函数,可以自动计算每个基因集所富集的功能分类。具体方法为:

Compare <- compareCluster(geneCluster=geneset, fun=”enrichKEGG”)

Plot(Compare)

http://image.sciencenet.cn/album/201604/19/194435vddknc7z0henmdkd.png

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有