加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

Stata:gen命令中的group()函数的潜在风险

(2020-06-24 15:03:55)
分类: Stata数据处理
原文链接:https://www.lianxh.cn/news/56d6e46376d31.html

目录

 


1. 问题背景

我们经常使用 generate (后文简称 gen) 命令提供的 group() 函数对某个变量进行分组,产生分组变量 gg,继而基于 gg 变量进行后续的分组回归分析。

例如,在公司金融中,常用如下代码产生融资约束的分组指标:

*-用公司规模衡量融资约束,分成三组 
. bysort code: egen av_size = mean(size)
. sort av_size 
. gen gg = group(3)
. gen  FC = (gg==1)     //小规模公司定义为 FC 组 
. replace FC=. if gg==2 //丢弃中间组 
. reg y x if FC==0 
. est store m_FC 
. reg y x if FC==1 
. est store m_NFC 
. esttab m_FC m_NFC

恐怖的事情就要发生了!

后续做分组回归时,你会发现:执行相同的代码,但两次得到的结果居然不同!

原因何在??


0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有