stata 生成虚拟变量
(2012-11-08 16:25:14)
标签:
杂谈 |
2011-03-31 19:50
stata 生成虚拟变量
生成虚拟变量
在很多场合,需要对分类变量(categorical variables)生成虚拟变量。
Stata提供的xi命令能很方便地实现这一点。这是Stata最引人入胜的功能之一。本文仅介绍xi命令最基本的用法:
xi [, prefix(string)] i.varname
varname是某一分类变量,设其共有m个可能的取值;string是prefix()指定的前缀。上述指令生成了K-1个虚拟变量:stringvarname_2,
stringvarname_3, …,
stringvarname_K。其中stringvarname表示字符串string和varname的联合。如果不使用[,
prefix(string)]选项,则默认的前缀是_I。
例:数据集中year的取值范围是2001,2002,2003,2004,2005,则指令 xi
i.year生成4个虚拟变量
_Iyear_2,_Iyear_3,_Iyear_4,_Iyear_5,分别对应year取值为2002,2003,2004,2005的情形。
-----------------------------------------------------------------------------------------------------------------------
tab x1,gen(x1) 产生x1的虚拟变量。
-----------------------------------------------------------------------------------------------------------------------
gen fsize1=fize==1 产生虚拟变量,如果family
size为1,则令fsize1=1,否则为零。下同。
gen fsize2=fsize==2
gen fsize3=fsize==3
gen fsize4=fsize==4
gen fsize5=fsize>=5