R语言ade4包PCA主成分分析步骤
| 分类: R学习 |
source("http://bioconductor.org/biocLite.R") ##启动Bioconductor
biocLite(“ade4”) ##安装ade4包
library(ade4) ##调用ade4包
setwd(“D:/”) ##设置文件存档地址
getwd() ##查看文件存档地址
gene<-read.table("1.txt", header=T,sep='') ##读取文件
文件格式如下:
http://s7/mw690/001HHwRSzy7n9XRJX8i36&690
第一列为分组信息,如果是两组,暂且分为0和1
head(gene) ##查看文件信息
row.names=1 ##第一列为样本名称
y<-as.factor(gene$name)##第二列为分组因子
pca1<-dudi.pca(gene[,3:7],scann=F,nf=7) ##nf代表因子数,这里总共涉及到gene3-7所以设置为7
gcol = c(3, 2)#作图时点的颜色
s.class(dfxy = pca1$li, fac = y, col = gcol, xax = 1, yax = 2)#分类作图
http://s13/mw690/001HHwRSzy7n9XTEddO1c&690
names(pca1) ##总共输出13箱都是输出结果
[1] "tab"
pca1$eig ## 输出特征值
[1] 3.5966164 0.6514622 0.3079472 0.2774258 0.1665484
barplot(pca1$eig) ##画出特征值碎石图
http://s11/mw690/001HHwRSzy7n9XVuPeq4a&690
kip <- 100 * pca1$eig/sum(pca1$eig) ##查看特征值贡献率命令
kip
[1] 71.932328 13.029243

加载中…