Stata:gen命令中的group()函数的潜在风险
(2020-06-24 15:03:55)分类: Stata数据处理 |
原文链接:https://www.lianxh.cn/news/56d6e46376d31.html
目录
1. 问题背景
我们经常使用 generate
gen
) 命令提供的 group()
例如,在公司金融中,常用如下代码产生融资约束的分组指标:
*-用公司规模衡量融资约束,分成三组
. bysort code: egen av_size = mean(size)
. sort av_size
. gen gg = group(3)
. gen FC = (gg==1) //小规模公司定义为 FC 组
. replace FC=. if gg==2 //丢弃中间组
. reg y x if FC==0
. est store m_FC
. reg y x if FC==1
. est store m_NFC
. esttab m_FC m_NFC
恐怖的事情就要发生了!
后续做分组回归时,你会发现:执行相同的代码,但两次得到的结果居然不同!
原因何在??