加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

指标选取的若干统计方法

(2015-08-01 13:34:05)

看看上条博客的第一句话,整个人都不好了。后来新三板的面试也没去,感觉自己真的太任性了。如果当时去了,或许我现在应该还在人大的图书馆悠闲地看小说,或者跟梦爷还是肉球去看电影。而现实是我坐在人满为患的浦东图书馆,一个人过着自己都不知道该如何打发的周末时光。

 

不扯没用的,直接说主题。毕业论文导师希望我们写与信用相关的东西,于是决定有必要看一看这一类的文章。今天在看消费信贷中个人信用评价方法的论文,当中提到了一个比较重要的知识——构建模型时指标的选取。目前对于这类问题,我大概仅限于想到主成分分析这一种方法。然而在现实中,主成分分析似乎也并不是放诸四海而皆准的。以下是盘点的几个常用的方法,可以帮助开拓思路:

 

1、极小广义方差法

根据条件广义方差极小的原则来选取代表性指标。用这种方法从p个指标中选取一个代表性指标的基本思想是:在统计学中,单个指标的信息量可以用其方差来反映。而多指标所包含的信息量则用其协方差矩阵的行列式值来度量。这就是广义方差的含义。因此,从p个指标中去掉某个指标后,剩下的p-1个指标的广义方差(实际上是条件广义方差)就反映了该指标作为代表而产生的信息量误差。如果该条件广义方差很小,就表示该条指标所包含的信息量在所有p个指标的总信息量中占有很大的份额。也就说明该指标具有很强的“代表性”。因此,从这个观点出发,使条件广义方差最小的那个指标就最具有代表性,这个指标就成为我们所要选取的代表性指标之一。重负这一过程,就可以选取若干有代表性的评价指标,并且评价人员还能将代表性误差控制在适当的范围内。(可以这样理解:假设总共P个指标是可以涵盖某个研究对象的所有有效信息。那么从中去掉某个指标p1后,其余指标的广义方差越大,说明对整体的预测误差越大。说明p1对整体的重要性更大,即代表性更强)

 

2、极大不相关法

这种方法的基本思想是:把p个指标中那些可以由其他指标“代替”的剔除掉,剩下的便是彼此不能替代的,并能全面反映原有p个指标所包含的评价信息。大致内容是:逐个计算每个指标与去掉该指标后剩下的p-1个指标间的复相关系数,那么使这p-1个复相关系数值最大的那个指标在很大程度上就可以被余下的p-1个指标提供的评价信息所决定,因此应剔除这个指标。重复这一个过程,直至留下若干相关性较小的评价指标为止。

3、主成分分析法

p个评价指标做主成分分析可以得到p个主成分,其中最后一个主成分包含原来p个指标的评价信息是最少的。因此在该主成分中起主要作用的评价指标对全部原始信息的贡献最少,所以剔除最后一个主成分中最大(绝对值)系数所对应的评价指标不会产生太大影响。对剩下的指标重复上面操作。准则:如果原来p个指标的相关矩阵有r个特征根接近于0,则至少应剔除r个原指标,因为特征根接近于0就意味着原始指标之间具有线性相关关系。(通过相反思路来选取较大的信息量的指标,也是一种方法)

或者,应该也可以通过主成分分析的方式,自己构造新的具有综合性意义的新指标。

4、聚类分析

先在相关系数矩阵的基础上对原始指标作聚类分析,然后在聚合的每类指标中各选出一个指标作为该类的代表性指标。各类代表性指标的选取办法是:计算每个指标与同类其他指标的决定系数(即简单相关系数的平方)的均值,使这些均值达到最大的那个指标剧作为该类的代表性指标。


(7.25)

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有