panel data 应用实例 stata code-1 (Pooled OLS)

标签:
面板数据例子pooledols |
分类: SAS_STATA_GAMS_MATLAB_Hadoop |
面板数据是cross section 和time series的结合,也被叫做 cross sectional time
series data, longitudinal data. 在处理面板数据的时候,常用的model是:OLS, Fixed
Effect model, Random Effect
model。这几篇博客会借助例子讨论如何选择模型,每个model又有什么潜在的问题,stata code怎么写等问题。
在Greene 的例子里,是table F7.1
这两个数据里变量的名称不同,但含义一样。这个例子里用的是第一个链接的数据。
airlines: 1-6代表六个不同的airlines;
year: 1-15 代表15年
数据本身已经是long form了, 关于long 和short的转变,在下面这个链接:
http://s15/mw690/002dDHI1gy6JTfKgZL81e&690data 应用实例 stata code-1 (Pooled OLS)" TITLE="panel data 应用实例 stata code-1 (Pooled OLS)" />
stata code:
or
regress cost output fuel
load
http://s3/mw690/002dDHI1gy6JThdKZj412&690data 应用实例 stata code-1 (Pooled OLS)" TITLE="panel data 应用实例 stata code-1 (Pooled OLS)" />
根据结果,regression model为:
根据结果,regression model为:
http://s4/mw690/002dDHI1gy6JThl2sozc3&690data 应用实例 stata code-1 (Pooled OLS)" TITLE="panel data 应用实例 stata code-1 (Pooled OLS)" />
在这个例子里,即使航空公司的output, fuel,
load都为零,cost为9.5169.
虽然F-test,
R-square都显示这个model很显著,但有没有可能每个航空公司的这个初始cost不同呢?在这个model里,也就是intercept(截距)有没有可能因为公司不同而不同?此外,有没有可能残差可能会根据航线和时间变化呢?
如果你有第一个怀疑,可能要用fixed effects;如果你有第二个怀疑,可能要用到random
effect。另外有计量的test辅助决定哪个model(OLS, Pooled OLS, Random Effects, Fixed
Effects).
注: 我并不是原创,不过是根据读书笔记整理出来的,稍后会把相关的reference整理出来。