STATA异常值处理
(2015-09-03 19:40:32)
标签:
股票 |
*设解释变量是x,被解释变量是y
cumul y, g(s) eq
cumul x, g(t) eq
replace y=. if s<.05|s>.95
replace x=. if t<.05|t>.95
drop s t
-------------------------------------------
*还可以用
xtile s=y,nq(20)
xtile t=x,nq(20)
replace y=. if s<2|s>19
replace x=. if t<2|s>19
drop s t
-------------------------------------------
还有一种方法是
对解释变量和被解释变量进行以下操作,产生一个只包含5%-95%之间数据的新变量:
winsor var1, gen(var11) p(.05)
winsor var2, gen(var22) p(.05)
……
就可以了
另,可能有的stata软件需要手动安装winsor程序后才能用
前一篇:stata数据按层分析的方法