寇文红2012年5月12日上午于复兴西路
我在2月22日写过一个报告《纯技术报告:补齐工业增加值同比序列中的缺失值》(见网址
http://blog.sina.com.cn/s/blog_6ee5069601010vhv.html),该报告设法补齐了国家统计局所发布的工业增加值未季调同比序列中的缺失值。本篇报告在此基础上,对这一未季调同比序列中的部分数据进行校准。鉴于过程非常枯燥,这里只写结论。首先回顾一下2月22日那篇报告的内容:
一、补齐工业增加值同比序列中2007-2012年1月的缺失值
目前国家统计局每月发布规模以上工业增加值同比、累计同比、季调环比(2011年4月开始发布2011年2月以来的环比)。在2007年之前,每月数据无缺失;在2007年之后,每年1月数据免报。即2007年以来,每年1月的工业增加值同比是缺失的,这给分析带来了很多困难:
【1】由于进行季节调整的ARIMA-X-11方法不允许时间序列中有缺失值,因此很多人在进行季节调整时,普遍简单地令1月同比等于2月同比,来构造定基指数。这其实是人为引入错误信息,导致季调结果不可信。
【2】我以前采用的TRAMO/SEATS季调方法允许有缺失值,但是每年增加一个缺失值,年头多了,也必然会影响SARIMA模型和季调精度,尤其是影响1月份季调环比的精度。
【3】没有1月同比,导致预测1、2月同比和1-2累计同比存在困难。
为了解决这些问题,我尝试补齐每年1月缺失的同比。在2月22日的报告中,我介绍了3种方法,并指出第1种方法是最符合逻辑、最准确、最可取的。这一方法的步骤是:
【1】先编制一个精确的工业增加值定基指数,其2007年-2011年1月数据缺失。这是难点所在,我用了两年时间才做到这一点。
【2】用2006年1-2月的累计值和2007年1-2月的累计同比得到2007年1-2月的累计值,然后减去2007年2月的单月值,就得到1月的单月值
【3】类似地可以计算出2008、2009.....年1月的单月值;然后计算得到1月单月同比;
显然,这一方法无论是在学术上还是在逻辑上都无懈可击。结果如下图所示。
http://s12/middle/6ee50696gbfceec21b24b&690
在2月22日,国家统计局还没报出2012年的数据,因此图1中没有补齐的2012年1月的数据。2012年3月9日,统计局发布了2012年2月单月同比是21.3%,1-2月累计同比是11.6%。据此可以计算出2012年1月单月同比应该是2.88%。
二、对工业增加值未季调同比序列进行校准
在2011年,我用自己编制的定基指数进行季节调整,所得到的各月季调环比与国家统计局发布的季调环比非常接近。
2012年3月9日,国家统计局发布2月当月同比的同时,还发布了2012年1、2月季调环比,并同时对2011年各月的季调环比回溯修正。这时我发现,用我的定基指数做季调得到的1、2月季调环比,与国家统计局发布的数据相去甚远。当时就怀疑统计局在进行季节调整时所依据的未季调同比,与它自己对外发布的未季调同比不一样。并且计算出统计局所依据的2012年1、2月未季调同比分别是3.7%和16.9%。
2012年5月11日,国家统计局就发布了4月的未季调同比和季调环比,并对之前各月的季调环比进行回溯修正。我对自己的定基指数进行重新检视,经过数百次计算,发现当把统计局发布的某几个月的未季调同比略加修改后,得到的季调环比与统计局发布的季调环比一样,否则就不一样。
图2中的绿色曲线是统计局发布的未季调同比,但是用这些数据算不出统计局发布的季调环比。需要使用图中红色曲线的数据才能算出统计局发布的季调环比。红线和绿线大部分是重合的,未重合的那些点中,2007-2012年1月的数据点是我补齐的,其他数据点是需要修正(或称校准)的地方。
http://s12/middle/6ee50696gbfceefd5494b&690
为了看得更清楚,我们把图2中2010-2012年的部分放大,见图3。
http://s3/middle/6ee50696gbfcef0b6bc22&690
采用经过校准之后的未季调同比构建定基指数,然后再进行季节调整,得到的季调环比与国家统计局发布的季调环比几乎完全一致。见图4。因此以后的分析中,应该采用补齐校准之后的数据。
http://s12/middle/6ee50696gbfcef2c1cc0b&690
加载中,请稍候......