[转载]SPSS分步骤学习(五)

标签:
转载 |
第二部分
1、Frequencies过程
1.1界面说明
Frequencies对话框的界面如下所示:
http://s5/bmiddle/4d6e9f51g6b56ecbebac4&690
下各部分的功能如下:
【Display frequency tables复选框】确定是否在结果中输出频数表。
【Statistics钮】单击后弹出Statistics对话框如下,用于定义需要计算的其他描述统计量。
http://s6/bmiddle/4d6e9f51g6b56f4cc25b5&690
各部分意义如下:
1、Percentile
Values复选框组定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points
for
2、Central tendency复选框组用于定义描述集中趋势的一组指标:均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。
3、Dispersion复选框组用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。
4、Distribution复选框组用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。
5、Values are group midpoints复选框当你输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框以通知SPSS,免得它犯错误。
众数(Mode)指所有数值中出现频率最高的一个值,在国内用的非常少。
【Charts钮】弹出Charts对话框,用于设定所做的统计图。
1、Chart type单选钮组 定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。
2、Chart Values单选钮组 定义是按照频数还是按百分比做图(即影响纵坐标刻度)。
【Format钮】弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。
1、Order by单选钮组 定义频数表的排列次序,有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。
2、Multiple Variables单选钮组 如果选择了两个以上变量做频数表,则Compare variables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,Organize output by variables则将结果在不同的频数表过程输出结果中显示。
3、Suppress Tables more than...复选框当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。
1.2分析实例
例6.1
某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5(卫统第三版p233
1.1题)。
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05
例:解:为节省篇幅,这里只给出精确频数表的做法,假设数据已经输好,变量名为X,具体解法如下:
1、Analyze==>Descriptive Statistics==>Frequencies
2、Variables框:选入X
3、单击Statistics钮:
4、选中Mean、Std.deviation、Median复选框
5、单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:
6、单击Continue钮
7、单击Charts钮:
8、选中Bar charts
9、单击Continue钮
10、单击OK
得出结果后手工计算出CV。
1.3结果解释
上题除直方图外的的输出结果如下:
Frequencies
http://s16/bmiddle/4d6e9f51g6b56fbb46bff&690
最上方为表格名称,左上方为分析变量名,可见样本量N为101例,缺失值0例,均数Mean=4.69,中位数Median=4.61,标准差STD=0.8616,P2.5=3.04,P97.5=6.45。
http://s11/bmiddle/4d6e9f51g6b56ff9a1fca&690
系统对变量x作频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。
2、Explore过程
Explore过程可对变量进行更为深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如枝叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析的方案。
2.1界面说明
【Display单选钮组 用于选择输出结果中是否包含统计描述、统计图或两者均包括。
【Dependent List框】 用于选入需要分析的变量。
【Factor List框】
【Label cases by框】选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录ID号的变量。
【Statistics钮】弹出Statistics对话框,用于选择所需要的描述统计量。有如下选项。
1、Descriptives复选框:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均数可信区间
2、M-estimators复选框:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数。
3、Outliers复选框:输出五个最大值与五个最小值。
4、Percentiles复选框:输出第5%、10%、25%、50%、75%、90%、95%位数。
【Plot钮】弹出Plot对话框,用于选择所需要的统计图。有如下选项
1、Boxplots单选框组:确定箱式图的绘制方式,可以是按组别分组绘制(Factor levels together),也可以不分组一起绘制(Depentends together),或者不绘制(None)。
2、Descriptive复选框组:可以选择绘制茎叶图(Stem-and-leaf)和直方图(Histogram)。
3、Normality plots with test复选框:绘制正态分布图并进行变量是否符合正态分布的检验。
4、Spread vs. Level with Levene Test单选框组:当选择了分组变量时,绘制spread-versus-level图(我还没有找到他的中文名字该叫什么),设置绘图时变量的转换方式,并进行组间方差齐性检验。
【Options钮】用于选择对缺失值的处理方式,可以是不分析有任一缺失值的记录、不分析计算某统计量时有缺失值的记录,或报告缺失值。
2.2结果解释
以例6.1的数据为例,按默认方式下的选择,Explore过程的输出如下:
http://s1/bmiddle/4d6e9f51g6b57115fec90&690
Explore
首先是例行的处理记录缺失值情况报告,可见101例均为有效值。
http://s16/bmiddle/4d6e9f51g6b57144b2a7f&690
上表详细列出了常用的描述统计量,如果有标准误也会列出(如偏度和峰度系数)。
X
X
Frequency Stem & Leaf
1.00
8.00
9.00
24.00
25.00
17.00
9.00
6.00
1.00
1.00 Extremes
Stem
width:
Each
leaf:
以上是茎叶图,整数位为茎,小数位为叶。这样可以非常直观的看出数据的分布范围及形态,
http://s2/bmiddle/4d6e9f51g6b5717c76f91&690
以上是箱式图,中间的黑粗线为均数,红框为四分位间距的范围,上下两个细线为最大、最小值。