SPSS分类:判别分析
(2014-05-08 15:13:54)
标签:
spss分类判别it |
分类: spss学习 |
一、概念:(分析-分类-判别)
判别分析与聚类分析不同。判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。
二、统计量:(分析-分类-判别-统计量)
1、描述性。可用选项为均值(包括标准差)、单变量ANOVA 以及Box 的M 检验。◎均值. 显示自变量的总均值、组均值和标准差。◎单变量ANOVA. 每个自变量的组均值的等同性执行单因子方差分析检验。◎Box’s M. 组协方差矩阵的等同性检验。对于足够大的样本,不显著的p 值表示断定矩阵不同的证据不足。该检验对于偏离多变量正态性很敏感。
2、函数系数。可用的选项有Fisher 的分类系数和未标准化的系数。◎Fisher. 显示可以直接用于分类的Fisher 分类函数系数。为每个组获得一组单独的分类函数系数,将一个个案分配给该组,该个案对此组具有最大判别分数(分类函数值)。◎未标准化. 显示未标准化的判别函数系数。
3、矩阵。可用的自变量系数矩阵有组内相关矩阵、组内协方差矩阵、分组协方差矩阵和总体协方差矩阵。◎组内相关. 显示汇聚的组内相关矩阵,获取该矩阵的方法是在计算相关性之前,求得所有组的单个协方差矩阵的平均值。◎组内协方差. 显示汇聚的组内协方差矩阵,该矩阵与总协方差矩阵可能不同。获取该矩阵的方法是,求得所有组的单个协方差矩阵的平均值。◎分组协方差. 显示每个组的分离协方差矩阵。◎总体协方差. 显示来自所有个案的协方差矩阵,就好像它们来自一个样本一样。
三、步进法(分析-分类-判别-方法)
1、方法。选择用于输入或移去新变量的统计量。可用统计量有Wilks 的lambda、未解释的方差、Mahalanobis 距离、最小F 比以及Rao 的V。使用Rao 的V,您可为要输入的变量指定在V 中增加的最小值。◎Wilks 的lambda. 一种用于逐步判别分析的变量选择方法,它基于变量能在多大程度上降低Wilks 的lambda 来选择要输入到方程中的变量。在每一步,均是输入能使总体Wilks 的lambda 最小的变量。◎未解释方差. 在每一步中输入使组间未解释变动合计最小的变量。◎Mahalanobis 距离. 自变量上个案的值与所有个案的平均值相异程度的测量。大的Mahalanobis 距离表示个案在一个或多个自变量上具有极值。◎最小F 值. 一种逐步分析中的变量选择方法,它基于使从组间Mahalanobis 距离计算得到的F 比最大。◎Rao 的V. 组均值之间的差分的测量。也称为Lawley-Hotelling 轨迹。在每一步,能使Rao 的V 增加最大的变量被选进来。选择此选项之后,请输入要进入分析,变量必须具有的最小值。
2、标准。可用的选项有使用F 值和使用F 的概率。为输入和移去变量输入值。◎使用F 值. 如果变量的F 值大于“输入”值,则该变量输入模型,如果F 值小于“剔除”值,则该变量从模型中移去。“输入”值必须大于“剔除”值,且两者均必须为正数。要将更多的变量选入到模型中,请降低“输入”值。要将更多的变量从模型中移去,请增大“剔除”值。◎使用F 的概率. 如果变量的F 值的显著性水平小于“输入”值,则将该变量选入到模型中,如果该显著性水平大于“剔除”值,则将该变量从模型中移去。“输入”值必须小于“剔除”值,且两者均必须为正数。要将更多的变量选入到模型中,请增加“输入”值。要将更多的变量从模型中移去,请降低“剔除”值。
3、显示。步进摘要显示了进行完每一步后所有变量的统计量;两两组间距离的F值为每一组对显示成对F 比的矩阵。
四、分类(分析-分类-判别-分类)
1、先验概率。此选项确定对于组成员身份的先验知识,是否调整分类系数。◎所有组相等。假设所有组的先验概率相等;这对系数没有影响。◎根据组大小计算。样本中的观察组大小决定组成员身份的先验概率。例如,如果分析中包括的50% 的观察值属于第一组,25% 属于第二组,25% 属于第三组,则会调整分类系数以增加第一组相对于其他两组的成员身份可能性。
2、显示。可用的显示选项有个案结果、汇总表和留一分类。◎个案结果. 为每个个案显示实际组的代码、预测组、后验概率和判别得分。◎摘要表. 基于判别分析,正确地和不正确地指定给每个组的个案数。有时称为“混乱矩阵”。◎不考虑该个案时的分类. 分析中的每个个案由除该个案之外的所有个案生成的函数来进行分类。这也称为“U 方法”。
3、使用均值替换缺失值。选择该选项,仅在分类阶段用自变量的均值代替缺失值。
4、使用协方差矩阵。您可用选择使用组内协方差矩阵或分组协方差矩阵对个案进行分类。◎在组内. 汇聚的组内协方差矩阵用来对个案分类。◎分组. 分组协方差矩阵用于分类。由于分类基于判别函数(而非基于原始变量),因此该选项并不总是等同于二次判别。
5、图。可用的图选项有组合组、分组和区域图。◎合并组. 创建前两个判别函数值的所有组散点图。如果只有一个函数,则转而显示一个直方图。◎分组. 创建前两个判别函数值的分组散点图。如果只有一个函数,则转而显示直方图。◎区域图. 用于基于函数值将个案分类到组的边界图。其个数对应于个案分类到的组数。每个组的均值在其边界内用一个星号表示。如果只有一个判别函数,则该图不会显示。