计量经济模型--3_柳运灵

http://blog.sina.com.cn/u/1651241360

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

计量经济模型--3

(2020-03-12 13:33:28)

标签：

计量经济学

计量经济模型的样本数据的收集

样本数据的收集与整理，是建立计量经济学模型过程中最为费时费力的工作，也是对模型质量影响极大的一项工作。从工作程序上讲，它是在理论模型建立之后进行，但实际上经常是同时进行的，因为能否收集到合适的样本观测值是决定变量取舍的主要因素之一。

1. 几类常用的样本数据

常用的样本数据有三类:时间序列数据、截面数据和虚变量数据。

时间序列数据是一批按照时间先后排列的统计数据，一般由统计部门提供，在建立计量经济学模型时应充分加以利用，以减少收集数据的工作量。在利用时间序列数据作样本时，要注意以下几个问题。一是所选择的样本区间内经济行为的一致性问题。例如，我们建立纺织行业生产模型，选择反映市场需求因素的变量，诸如居民收入、出口额等作为解释变量，而没有选择反映生产能力的变量，诸如资本、劳动等，原因是纺织行业属于供大于求的情况。对于这个模型，利用时间序列数据作样本时，只能选择80年代后期以来的数据，因为纺织行业供大于求的局面只出现在这个阶段，而在80年代中期以前的一个长时期里，我国纺织品是供不应求的，那时制约行业产出量的主要因素是投入要素。二是样本数据在不同样本点之间的可比性问题。经济变量的时间序列数据往往是以价值形态出现的，包含了价格因素，而同一件实物在不同年份的价格是不同的，这就造成样本数据在不同样本点之间不可比。需要对原始数据进行调整，消除其不可比因素，方可作为模型的样本数据。三是样本观测值过于集中的问题。经济变量在时间序列上的变化往往是缓慢的，例如，居民收入每年的变化幅度只有5%左右。如果在一个消费函数模型中，以居民消费作为被解释变量，以居民收入作为解释变量，以它的时间序列数据作为解释变量的样本数据，由于样本数据过于集中，所建立的模型很难反映两个变量之间的长期关系。这也是时间序列不适宜于对模型中反映长期变化关系的结构参数的估计的一个主要原因。四是模型随机误差项的序列相关问题。用时间序列数据作样本，容易引起模型随机误差项产生序列相关。这个问题后面还要专门讨论。

截面数据是一批发生在同一时间截面上的调查数据。工业普查数据、人口普查数据、家计调查数据等，主要由统计部门提供。用截面数据作为计量经济学模型的样本数据，应注意以下几个问题。一是样本与母体的一致性问题。计量经济学模型的参数估计，从数学上讲，是用从母体中随机抽取的个体样本估计母体的参数，那么要求母体与个体必须是一致的。例如，估计煤炭企业的生产函数模型，只能用煤炭企业的数据作为样本，不能用煤炭行业的数据。那么，截面数据就很难用于一些总量模型的估计，例如，建立煤炭行业的生产函数模型，就无法得到合适的截面数据。二是模型随机误差项的异方差问题。用截面数据作样本，容易引起模型随机误差项产生异方差。这个问题后面还要专门讨论。

虚变量数据也称为二进制数据，一般取0或1。虚变量经常被用在计量经济学模型中，以表征政策、条件等因素。例如，建立我国的粮食生产计量经济学模型，以粮食产量作为被解释变量，解释变量中除了播种面积、化肥使用量、农机总动力、成灾面积等变量外，显然，政策因素是不可忽略的。实行了不同的政策，即使上述变量都没有变化，粮食产量也会发生大的变化。于是必须在解释变量中引人政策变量，用一个虚变量表示，虚变量的样本观测值为1，以前的年份，该虚变量的样本观测值为0。也可以取0、l以外的数值，表示该因素的变化程度。工业生产模型中用虚变量表示气候对工业生产的影响，可以将不同年份气候的影响程度，分别用0、1、-1，甚至0.5、-0.5等表示。不过，这种方法应慎用，以免违背客观性。

2. 样本数据的质量

样本数据的质量问题大体上可以概括为完整性、准确性、可比性和一致性四个方面。

完整性，即模型中包含的所有变量都必须得到相同容量的样本观测值。这既是模型参数估计的需要，也是经济现象本身应该具有的特征。但是，在实际中，"遗失数据"的现象是经常发生的，经济体制和核算体系都处于转轨之中。在出现"遗失数据"时，如果样本容量足够大，样本点之间的联系并不紧密的情况下，可以将"遗失数据"所在的样本点整个地去掉;如果样本容量有限，或者样本点之间的联系紧密，去掉某个样本点会影响模型的估计质量，则要采取特定的技术将"遗失数据"补上。

准确性，有两方面含义，一是所得到的数据必须准确反映它所描述的经济因素的状态，即统计数据或调查数据本身是准确的;二是它必须是模型研究中所准确需要的，即满足模型对变量口径的要求。前一个方面是显而易见的，而后一个方面则容易被忽视。例如，在生产函数模型中，作为解释变量的资本、劳动等必须是投入到生产过程中的、对产出量起作用的那部分生产要素，以劳动为例，应该是投入到生产过程中的、对产出量起作用的那部分劳动者。于是，在收集样本数据时，就应该收集生产性职工人数，而不能以全体职工人数作为样本数据，尽管全体职工人数在统计上是很准确的，但其中有相当一部分与生产过程无关，不是模型所需要的。

可比性，也就是通常所说的数据口径问题，在计量经济学模型研究中可以说无处不在。而人们容易得到的经济统计数据，一般可比性较差，其原因在于统计范围口径的变化和价格口径的变化，必须进行处理后才能用于模型参数的估计。计量经济学方法，是从样本数据中寻找经济活动本身客观存在的规律性，如果数据是不可比的，得到的规律性就难以反映实际。不同的研究者研究同一个经济现象，采用同样的变量和数学形式，选择的样本点也相同，但可能得到相差甚远的模型参数估计结果。为什么?原因在于样本数据的可比性。例如，采用时间序列数据作为生产函数模型的样本数据，产出量用不变价格计算的总产值，在不同年份间是可比的;资本用当年价格计算的固定资产原值，在不同年份间是不可比的。对于统计资料中直接提供的这个用当年价格计算的固定资产原值，有人直接用于模型估计，有人进行处理后再用于模型的估计，结果当然不会相同。

一致性，即母体与样本的一致性。讨论用截面数据作为计量经济学模型的样本数据时已经作了介绍。违反一致性的情况经常会发生，例如，用企业的数据作为行业生产函数模型的样本数据，用人均收入与消费的数据作为总量消费函数模型的样本数据，用31个省份的数据作为全国总量模型的样本数据，等等。

模型参数的估计

模型参数的估计方法，是计量经济学的核心内容。在建立了理论模型并收集整理了符合模型要求的样本数据之后，就可以选择适当的方法估计模型，得到模型参数的估计量。模型参数的估计是一个纯技术的过程，包括对模型进行识别(对联立方程模型而言)、估计方法的选择、软件的应用等内容。在后面的章节中将用大量的篇幅讨论估计问题，在此不重复叙述。

模型的检验

在模型的参数估计量已经得到后，可以说一个计量经济学模型已经初步建立起来了。但是，它能否客观揭示所研究的经济现象中诸因素之间的关系，能否付诸应用，还要通过检验才能决定。一般讲，计量经济学模型必须通过四级检验，即经济意义检验、统计学检验、计量经济学检验和预测检验。

1. 经济意义检验

经济意义检验主要检验模型参数估计量在经济意义上的合理性。主要方法是将模型参数的估计量与预先拟定的理论期望值进行比较，包括参数估计量的符号、大小、相互之间的关系，以判断其合理性。

首先检验参数估计量的符号。例如，有下列煤炭行业生产模型:

煤炭产量=-108.5427+0.00067×固定资产原值+0.01527×职工人数

-0.00681×电力消耗量+0.00256×木材消耗量

在该模型中，电力消耗量前的参数估计量为负，意味着电力消耗越多，煤炭产量越低，从经济行为上无法解释。模型不能通过检验，应该找出原因重新建立模型。

如果所有参数估计量的符号正确，则要进一步检验参数估计量的大小。例如，有下列煤炭企业生产函数模型:

Ln(煤炭产量) = 2.69+1.85Ln(固走资产原值)+0.51Ln(职工人数)

因为该模型是一个对数线性模型，所以在该模型中，固定资产原值前的参数的经济意义是明确的，即固定资产原值的产出弹性;表示当固定资产原值增加1%时煤炭产量增加的百分数。根据产出弹性的概念，该参数估计量应该是0与1之间的一个数，模型中的参数估计量虽然符号正确，但是数值范围与理论期望值不符，不能通过检验。应该找出原因重新建立模型。

即使模型参数估计量的符号正确、数值范围适当，仍然不能说已经通过经济意义检验，还要对参数之间的关系进行检验。例如，有下列职工家庭日用品需求模型:

Ln(人均购买日用品支出额)= -3.69+1.20Ln(人均收入)一6.40Ln(日用品类价格)

该模型也是一个对数线性模型，所以在该模型中，人均收入和日用品类价格前的参数的经济意义是明确的，即是它们各自的需求弹性。该二参数估计量的符号是正确的，数值范围大体适当。但是根据经济意义，二参数估计量之和应该在1左右，因为当收入增长1%、价格增长1%时，人均购买日用品支出额也应该增长1%左右。显然该模型的参数估计量不能通过检验。应该找出原因重新建立模型。

只有当模型中的参数估计量通过所有经济意义的检验，方可进行下一步检验。模型参数估计量的经济意义检验是一项最基本的检验，经济意义不合理，不管其他方面的质量多么高，模型也是没有实际价值的。

2. 统计检验

统计检验是由统计理论决定的，检验模型的统计学性质。通常最广泛应用的统计检验准则有拟合优度检验、变量和方程的显著性检验等。

3. 计量经济学检验

计量经济学检验是由计量经济学理论决定的，检验模型的计量经济学性质。通常最主要的检验准则有随机误差项的序列相关检验和异方差性检验，解释变量的多重共线性检验等。

4. 模型预测检验

预测检验主要检验模型参数估计量的稳定性以及相对样本容量变化时的灵敏度，确定所建立的模型是否可以用于样本观测值以外的范围，即模型的所谓超样本特性。

具体检验方法为:

(1)利用扩大了的样本重新估计模型参数，将新的估计值与原来的估计值进行比较，并检验二者之间差距的显著性;

(2)将所建立的模型用于样本以外某一时期的实际预测，并将该预测值与实际观测值进行比较，并检验二者之间差距的显著性。

经历并通过了上述步骤的检验后，可以说已经建立了所需要的计量经济学模型，可以将它应用于预定的目的。

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：计量经济模型--2

后一篇：计量经济模型---4

新浪BLOG意见反馈留言板　欢迎批评指正