Stata:评估面板数据模型的样本外预测性能-xtoos
(2023-07-31 15:42:41)
标签:
stata面板数据模型样本外预测性能xtoos |
分类: Stata新命令 |
目录
1. 背景
在广泛的实际应用中,评估一个统计模型的预测准确性变得愈发普遍和重要。不过,现有应用都集中在一种数据结构上,要么是时间序列,要么是非结构化、截面数据或者合并数据。面板数据存在时间序列和个体两个维度,那么如何评价一个面板数据统计模型的预测性能呢?目前 Stata 中没有合适的命令来评估时间序列维度中模型的样本外性能。
此外,现有的交叉验证 (cross-validation) 程序 (如 crossfold
cvauroc
)
在分离样本内和样本外时,通常会对所有的观测值进行处理,而不考虑这些观测值是否属于不同的个体或来自同一个体的后续观测。因此很难引入一个动态效应模型或固定效应模型。
通常我们将一个模型的性能表示为与另一个替代模型的相对值。例如,在评估时间序列框架中的预测准确性时,模型的 RMSE 通常与“朴素 (naive)”预测的 RMSE 进行比较。其中样本内时期的最后一个观测值被用作对样本外观测值的直接预测。
但是,如果我们只是随机抽取观察结果,那么“朴素”的预测会是什么?本文认为,在面板数据的情况下,更有用的练习是使用个体而不是观察值的类似于交叉验证的练习。
因此,我们开发了4个新的命令 xtoos_t
,xtoos_i
,xtoos_bin_t
xtoos_bin_i
,分别评估面板数据模型在时间序列和截面维度上的样本外预测性能,还为不同类型的因变量
(连续变量和 0-1 变量) 开发了单独的程序。