加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

补齐工业增加值序列中每年1月的缺失值

(2012-02-22 10:56:13)
标签:

杂谈

    版权所有。寇文红2012年2月22日。

 

    目前国家统计局每月发布规模以上工业增加值同比、累计同比、季调环比(2011年4月开始发布2011年2月以来的环比)。在2007年之前,每月数据无缺失;在2007年之后,每年1月数据免报。这种数据缺失给分析带来了很多困难:
    【1】由于进行季节调整的ARIMA-X-11方法不允许时间序列中有缺失值,因此我的同行们在进行季节调整时,普遍简单地令1月同比等于2月同比,来构造定基指数。这其实是人为引入错误信息,导致季调结果不可信。
    【2】我以前采用的季调方法允许有缺失值,但是每年增加一个缺失值,年头多了,比如会影响SARIMA模型和季调精度,尤其是影响1月份季调环比的精度(虽然国家统计局不发布1月环比,但是我们要提高对自己的要求)。

    【3】没有1月同比,导致预测1、2月同比和1-2累计同比存在困难。

为了解决这些问题,我尝试补齐每年1月缺失的同比数据。先后构思了三种方法,下面先介绍最靠谱的一种:

    方法一:
   【1】先编制一个精确的工业增加值定基指数,其2007年-2011年1月数据缺失。未季调环比的缺乏导致定基指数难以编制。我在2009-2010年经过2年的摸索之后,已经于2010年9月30日完成了这项工作。我相信自己编制的定基指数是精确的,是因为用它进行季调得到的环比与国家统计局发布的季调环比几乎一样(虽然季调方法不同),参加微博438。
   【2】用2006年1-2月的累计值和2007年1-2月的累计同比得到2007年1-2月的累计值,然后减去2007年2月的单月值,就得到1月的单月值;

   【3】类似地可以计算出2008、2009.....年1月的单月值;然后计算得到1月单月同比; 

    显然,上述方法简单而绝妙,并且无论是在学术上还是在逻辑上都无懈可击。结果如下图所示。其意义我就不说了。结合每年春节所在的日期,也可以看出这个结果是合理的。http://s7/middle/6ee50696gb984c43a9016&690
 方法二:
   【1】先编制一个精确的工业增加值定基指数。

   【2】根据季节性对1月进行插值。

    这个方法也简单易行,在学术和逻辑上都无懈可击,但是显然不如方法一精确。结果如下图。
http://s2/middle/6ee50696gb984c7bea991&690

    此外还有一种方法是做回归,结果更不精确,不再赘述。

    我将用方法一的结果对之前的季调结果进行修正,并设法对1、2月同比、1-2月累计同比进行预测(似乎很困难)。

    我建议资本市场和学术界的同行们在对工业增加值进行预处理时引用方法一的结果,不要再瞎搞了。

 

 

 

 

 


 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有