【R高级教程】专题二:差异表达基因的分析

分类: 【转】NGS算法 |
应学生及个别博友的要求,尽管专业博文点击率和反应均很差,但在去San Diego参加PAG会议之前,还是抽时间给出【R高级教程】的第二专题。专题一给出了聚类分析的示例,本专题主要谈在表达谱芯片分析中如何利用Bioconductor鉴定差异表达基因。
>library(limma)
>design <- model.matrix(~ -1+factor(c(1,1,1,
2,2,2)))
>colnames(design) <- c("control",
"LPS")
>fit <- lmFit(eset2, design)
>contrast.matrix <- makeContrasts(control-LPS,
levels=design)
>fit <- eBayes(fit)
>fit2 <- contrasts.fit(fit,
contrast.matrix)
>fit2 <- eBayes(fit2)
>results<-decideTests(fit2, method="global",
adjust.method="BH", p.value=0.01, lfc=1.5)
>summary(results)
http://blog.sciencenet.cn/upload/blog/images/2011/1/2011112112539695.JPG
>vennCounts(results)
>vennDiagram(results)
http://blog.sciencenet.cn/upload/blog/images/2011/1/201111211245670.jpg
http://blog.sciencenet.cn/upload/blog/images/2011/1/2011112112648148.JPG
>heatDiagram(results,fit2$coef)
http://blog.sciencenet.cn/upload/blog/images/2011/1/2011112112613820.jpg
>x<-topTable(fit2, coef=1, number=10000, adjust.method="BH",
sort.by="B", resort.by="M")
>write.table(x, file="limma.xls", row.names=F,
sep="\t")
>y <- x[xP.Value
>length(y
【除Bioconductor的logo,所有图片均由程序运行所得】