R语言-如何生成虚拟变量
(2013-07-08 17:38:19)分类: 数据分析工具 |
今天从豆瓣上学到一招:
create dummy variables from categorical
variables.
> dummy_variable =
model.matrix(~factor(categorical_variable)-1)
> dum =
as.data.frame(dummy_variable)
> names(dum) = paste("dummy", 1:length(dum[1,]),
sep="")
这里categorical_variable可以是一个矩阵或者数据框或者向量
model.matrix是对表型协变量的水平进行design,比如:
design <- model.matrix(~ -1+factor(c(1,1,1, 2,2,2)))
含义就是你有2组每组重复3次共6次试验,前3次是1组的,后3次是2组的
结果为:
1 0
1 0
1 0
0 1
0 1
0 1