加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

panel data 应用实例 stata code-1 (Pooled OLS)

(2014-06-23 06:30:02)
标签:

面板数据

例子

pooled

ols

分类: SAS_STATA_GAMS_MATLAB_Hadoop
面板数据是cross section 和time series的结合,也被叫做 cross sectional time series data, longitudinal data. 在处理面板数据的时候,常用的model是:OLS, Fixed Effect model, Random Effect model。这几篇博客会借助例子讨论如何选择模型,每个model又有什么潜在的问题,stata code怎么写等问题。

pooled OLS: 假设在组和时间上,截距和斜率都是相同的。

在Greene 的例子里,是table F7.1
这两个数据里变量的名称不同,但含义一样。这个例子里用的是第一个链接的数据。
airlines: 1-6代表六个不同的airlines;
year: 1-15 代表15年
数据本身已经是long form了, 关于long 和short的转变,在下面这个链接:
http://s15/mw690/002dDHI1gy6JTfKgZL81e&690data 应用实例 stata code-1 (Pooled OLS)" TITLE="panel data 应用实例 stata code-1 (Pooled OLS)" />
stata code:
 use "C:\Users\airline.dta", clear
or 
 use http://www.indiana.edu/~statmath/stat/all/panel/airline.dta, clear 

keep airline year cost output fuel load 

regress cost output fuel load

http://s3/mw690/002dDHI1gy6JThdKZj412&690data 应用实例 stata code-1 (Pooled OLS)" TITLE="panel data 应用实例 stata code-1 (Pooled OLS)" />
根据结果,regression model为:
http://s4/mw690/002dDHI1gy6JThl2sozc3&690data 应用实例 stata code-1 (Pooled OLS)" TITLE="panel data 应用实例 stata code-1 (Pooled OLS)" />
在这个例子里,即使航空公司的output, fuel, load都为零,cost为9.5169. 

虽然F-test, R-square都显示这个model很显著,但有没有可能每个航空公司的这个初始cost不同呢?在这个model里,也就是intercept(截距)有没有可能因为公司不同而不同?此外,有没有可能残差可能会根据航线和时间变化呢?

如果你有第一个怀疑,可能要用fixed effects;如果你有第二个怀疑,可能要用到random effect。另外有计量的test辅助决定哪个model(OLS, Pooled OLS, Random Effects, Fixed Effects). 

注: 我并不是原创,不过是根据读书笔记整理出来的,稍后会把相关的reference整理出来。

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有