加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

R语言ade4包PCA主成分分析步骤

(2018-08-27 17:25:57)
分类: R学习

source("http://bioconductor.org/biocLite.R") ##启动Bioconductor

biocLite(“ade4”) ##安装ade4

library(ade4) ##调用ade4

setwd(“D:/”) ##设置文件存档地址

getwd() ##查看文件存档地址

gene<-read.table("1.txt", header=T,sep='') ##读取文件

 

文件格式如下:

http://s7/mw690/001HHwRSzy7n9XRJX8i36&690

第一列为分组信息,如果是两组,暂且分为01

head(gene) ##查看文件信息

row.names=1 ##第一列为样本名称

y<-as.factor(gene$name)##第二列为分组因子

pca1<-dudi.pca(gene[,3:7],scann=F,nf=7) ##nf代表因子数,这里总共涉及到gene3-7所以设置为7

gcol = c(3, 2)#作图时点的颜色

s.class(dfxy = pca1$li, fac = y, col = gcol, xax = 1, yax = 2)#分类作图

http://s13/mw690/001HHwRSzy7n9XTEddO1c&690

names(pca1) ##总共输出13箱都是输出结果

[1] "tab"  "cw"   "lw"   "eig"  "rank" "nf"   "c1"   "li"   "co"   "l1"  "call" "cent" "norm" 每一项都有特殊意义,其中eig代表的是特征值

pca1$eig ## 输出特征值

[1] 3.5966164 0.6514622 0.3079472 0.2774258 0.1665484

 

barplot(pca1$eig) ##画出特征值碎石图

http://s11/mw690/001HHwRSzy7n9XVuPeq4a&690

kip <- 100 * pca1$eig/sum(pca1$eig) ##查看特征值贡献率命令

kip

[1] 71.932328 13.029243  6.158943  5.548516  3.330968

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有