基本操作
读取数据
读取文件
data list file=’’ fixed/free
/{varname} {format}.
读取数列
data list
/{varname} {format}.
begin data
{data list}
end data.
读取矩阵
matrix data variable {varname}
/file=’’
/n={n}
/contents=corr.
数据编辑
变量名
变量名不超过8个字符, 名首必须是字母
变量标签
variable labels {varname} ’’.
不能超过40个字符
值标签
value labels {varname} {value} ’’.
不能超过20个字符
形式
format {varname} (f{w.d}).
缺失值
missing values {varname} ().
排序
sort cases by {varname} (a/b).
数据合并
add files
/file=*
/file=’’
/rename {old varname}={new varname}
/drop {varname}.
数据转换
Compute
compute {target varname}={expression}.
算术运算:+,-,*,/,**(幂)
算术函数:sqrt, rnd(四舍五入), trunc(取整)
统计函数:mean, sum, sd, max, min
缺失值函数:SYSMIS,MISSING,NMISS,NVALID,VALUE(不算缺失值)
时间函数: CTIME.DAYS,$JDATE
If
if () {target varname}={expression}.
Recode
recode {varname} (old value /else/lowest through {value}/{value} through {value}/{value} through high=new value) into {newvarname}.
Missing values:user-defined 也会被重编码,因此应小心user-defined. user-defined 不包括在范围内
Split file
Sort cases by {varname} .
split file
layered by {varname} .
split file
off.
Flip
flip variables = {varname}/all.
Rank
rank variable = {varname}.
数据分析
描述性统计
Frequencies
Frequencies {varname}
/histogram NORMAL /barchart (freq/percent)/piechart.
Descriptive
Descriptive {varname}
/statistics=sum mean min max (集中趋势) RANGE stddev SEMEAN VARIANC
(离中趋势) skewness(偏度) SESKEW KURTOSIS(峰度) SEKURT(形状测量)
/{varname} (z{newvarname}).
Explore
examine {varname}
/plot BOXPLOT STEAMLEAF HISTOGRAM(不带有正态曲线) NPPLOT(证明正态)
/ STATISTICS DESCRIPTIVES EXTREME
/MESTIMATORS(修正均值).
Crosstabs
Crosstabs
/tables={row varname} BY {column varname}
/Statistic=chisq(默认) corr KAPPA(评定者间一致性系数)PHI CC(修正)
/CELLS= .
相关分析
Graph
scatterplot={varname} with {varname}.
Person
correlations
/variables={varlist}
/ MISSING=PAIRWISE/LISTWISE(数据足够时更稳定).
Spearman/kendall(顺序变量)
nonpar corr
/variables={varlist}
/print=spearman(默认)/kendall(有重复)/both.
差异性检验
![spss <wbr>命令 spss <wbr>命令]()
单样本t检验
t-test testval={value}
/variables={varname}.
独立样本t检验
t-test groups={varname}(value1 value2)
/variables={varname}.
相关样本t检验
t-test pairs={varname} with {varname}.
曼-惠特尼U检验
npar tests
/ m-w={varname} with { value1 value2}.
维克尔松检验
npar test
/ wilcoxon={varname} with {varname}.
方差分析
前提假设:独立、等距、正态、同质
数据要求:多元正态,线性(散点图)
Oneway anova(单一自变量平-单一因变量)
oneway
{varlist} by {varname}
/statistics descriptives homogeneity
/contrast {valuelist}
/posthoc=LSD TURKEY(敏感)BONFERRONI Scheffe(保守) snk DUNNETT.
Unianova(多个自变量-单一因变量)
unianova
{dependent varname} BY {factor varlist}
/posthoc {varlist}=lsd snk turkey
/plot=profile({varname/varname*varname})
/desigh={factor varlist}.
manova
{dependent varname} BY {factor varlist}
/DESIGN={FACNAME1} within {FACNAME2}(FACNUM1) {FACNAME1} within {FACNAME2}(FACNUM2)…
Multivariate(多个自变量-多个因变量)
glm
{dependent varlist} BY {factor varlist}
/desigh={factor varlist}
/PRINT = HOMOGENEITY(同质性前提)
/plot=profile({varname/varname*varname})
/posthoc {varlist}=lsd snk turkey
manova
{dependent varlist} BY {factor varlist}
/DESIGN={FACNAME1} within {FACNAME2}(FACNUM1) {FACNAME1} within {FACNAME2}(FACNUM2)…
REPEATED MEASURE(包含组内自变量-多个因变量)
glm
{wsfactor varlist} BY {factor varlist}
/WSFACTORs {wsfacname} {wsfacnum}
/wsdisigh {wsfaclist}
/desigh={varlist}
/emmeasn = tables(varname) compare adj(lsd)
/plot=profile({varname/varname*varname/varname*wsfacname})
manova
{wsfactor varlist} BY {facname} (facnum)
/WSFACTORS {wsfacname} (wsfacnum)
/WSDESIGN ={WSFACNAME1} within {WSFACNAME2}(WSFACNUM1) {WSFACNAME1} within {WSFACNAME2}(WSFACNUM2)…
/DESIGN={FACNAME1} within {FACNAME2}(FACNUM1) {FACNAME1} within {FACNAME2}(FACNUM2)…
/WSDESIGN={WSFACNAME}
/DESIGN=MWITHIN {FACNAME} (FACNUM1) MWITHIN {FACNAME} (FACNUM2) …
/DESIGN={FACNAME}
/WSDESIGN=MWITHIN {WSFACNAME} (WSFACNUM1) MWITHIN {WSFACNAME} (WSFACNUM2)….
回归分析
前提假设:等距/等比/(顺序) 线性 非共线性 残差正态,同质,线性
数据要求:cases : variables=10:1;被试数目> 100;无Outliers();无multicollinearity
IGRAPH
/VIEWNAME='Scatterplot'
/X1 = VAR(before) TYPE = SCALE
/Y = VAR(after) TYPE = SCALE
/COORDINATE = VERTICAL
/FITLINE METHOD = REGRESSION LINEAR LINE = TOTAL SPIKE=OFF
/X1LENGTH=3.0
/YLENGTH=3.0
/X2LENGTH=3.0
/CHARTLOOK='NONE'
/SCATTER COINCIDENT = NONE.
EXE.
REGRESSION
/DEPENDENT {DEPENDENT VARNAME}
/METHOD=STEPWISE/ENTER {FACTOR VARLIST}
/STATISTICS COEFF() OUTS R ANOVA COLLIN(检验multicollinearity)
/CASEWISE(检验outlier) .
聚类分析
CLUSTER {VARLIST}
/PRINT SCHEDULE CLUSTER(CLUNUM)
/PLOT DENDRGRAM VICICLE
主成分分析
前提假设:多元正态 线性 等距(顺序) 相关-
数据要求:cases : variables=5:1;被试数目>200;正态不是必须,如果正态分布,解决会更好;线性:如果非线性,应考虑转换变量后再作因素分析;无Outliers;在主成分分析中,multicollinearity不是问题,在主因素分析中,不能有 multicollinearity
相关矩阵
FACTOR
/MATRIX=IN(CORR=*)
/method=correlation
/format=sort blank(0.40)
/ROTATION VARIMAX
/PLOT=EIGEN rotation.
一般主成分分析
FACTOR
/VARIABLES {VARLIST}
/PLOT EIGEN ROTATION
/ROTATION VARIMAX
/METHOD=CORRELATION
/PRINT KMO (相关和共线性检验).
数据报告
描述性统计
Frequencies
Descriptive
• 报告Descriptives
峭度为正表示总体分布的峰态较标准正态更陡; 反之更缓.
斜度为正表示样本值比较集中于均值的左边; 斜度为负表示样本值比较集中于均值的右边
Explore
• 报告Descriptives
去掉5%的均值5% trimmed mean 四分位距interquartile range
• 读Respondent’s Stem-and-Leaf Plot
• 读Respondent’s Boxplot
Outlier:从矩形框始,在1.5 倍箱距的点之外
Extreme:从矩形框始,在3倍箱距的点之外
1.5 倍箱距的点之外的Outlier需要给予注意,如果是多于3个点位置很近,多数情况考虑保留。3 倍箱距的点之外的Extreme value需要给予特别注意,如果是孤立的点,多数情况考虑可以作为缺失值计算一次,作为有效值计算一次。
• 读Normal Q-Q Plot of Respondent's
X轴:实得分数 Y轴:Z分数的期望值 如果呈线性说明正态分布
Crosstabs
• 报告Respondent's A*B Crosstabulation
单位格 standardized residual > 2.0引起chi-square 增加或显著
• 报告Chi-Square Tests
报告自由度 df = (r-1) * (c-1)
E 的最小值 < 5, c ²可能不准确
Chi Square 统计量不是描述相关的良好指标。因为它随样本量变化而变化。两变量间各种类型的相关都会产生一样的Chi Square 值。
相关分析
• 报告Graph
散点图提示的outlier 需要特别处理
散点图也帮助我们找出multivariate outlier,关系的异常值
• 报告Correlations-Correlations和Nonparametric Correlations - Correlation
对数据的相关分析显示,a与b有显著相关,r(df)=,p<.001,双尾
差异性检验
单样本t检验
• 报告One-Sample Test
独立样本t检验
• 报告Independent Samples Test
• 如果Levene's Test for Equality of Variances不显著,报告Equal variances assumed 的Welch'st test结果。
• 如果Levene's Test for Equality of Variances显著,报告Equal variances not assumed 的t test 结果。
a的均值(M =, SD =) 与b(M =, SD =)有显著差异 。t(df) =, p = <0.05。
相关样本t检验
• 报告Paired Samples Test
•
曼-惠特尼U检验(独立样本)
• 报告Test Statistics
维克尔松检验(相关样本)
方差分析
One way anova
• 看Descriptives
• 报告ANOVA
• 报告Multiple Comparisons
a的均值(M =, SD =) 、b的均值(M =, SD =)和c的均值(M =, SD =)有显著差异 。t(df) =, p = <0.05。事后检验显示,a与b有显著差异,a-b=,p=<0.05; c与b有显著差异,c-b=,p=<0.05; a与c有显著差异,a-c=,p=<0.05。
Unianova
• 主效应和交互作用报告Tests of Between-Subjects Effects
自变量只有两组时,报告Hotelling’s Trace;自变量大于两组时,报告Wilk’s Lambda;
方差齐性的统计前提被违反时,报告Pillai’s Trace 。
• 如果是不平衡处理,事后检验报告Estimated Marginal Means- Pairwise Comparisons(Option)
• 如果是平衡处理报告,事后检验报告Pairwise Comparisons(Posthoc)
• 交互作用图报告Profile Plots
**因素方差分析结果显示,a与b交互作用显著,F()=,p<0.05,交互作用图如图1。简单效应结果显示,a1在b1(M=,SD=)和b2(M=,SD=)上有显著差异,F()=,p<0.05;a2在b1(M=,SD=)和b2(M=,SD=)上有显著差异,F()=,p<0.05。a的主效应显著,F()=,p<0.05;b的主效应显著,F()=,p<0.05。
Multivariate
• 报告Box's Test of Equality of Covariance Matrices
• 简单效应结果报告Manova
• 如果是不平衡处理,事后检验报告Estimated Marginal Means- Pairwise Comparisons(Option)
• 如果是平衡处理报告,事后检验报告Pairwise Comparisons(Posthoc)
• 交互作用图报告Profile Plots
**因素方差分析结果显示,a与b交互作用显著,F()=,p<0.05,交互作用图如图1。简单效应结果显示,a1在b1(M=,SD=)和b2(M=,SD=)上有显著差异,F()=,p<0.05;a2在b1(M=,SD=)和b2(M=,SD=)上有显著差异,F()=,p<0.05。a的主效应显著,F()=,p<0.05;b的主效应显著,F()=,p<0.05。
REPEATED MEASURE
• 如果Mauchly test of sphericity检验不显著,交互作用、组内主效应结果报告Tests of Within-Subjects Effects
• 如果Mauchly test of sphericity检验显著,交互作用、组内主效应结果报告Multivariate Tests
• 组建主效应报告Tests of Between-Subjects Effects
自变量只有两组时,报告Hotelling’s Trace;自变量大于两组时,报告Wilk’s Lambda;
方差齐性的统计前提被违反时,报告Pillai’s Trace 。
• 简单效应结果报告Manova
• 组内变量事后检验结果报告Estimated Marginal Means-Pairwise Comparisons
• 如果是不平衡处理,组间变量事后检验报告Estimated Marginal Means- Pairwise Comparisons(Option)
• 如果是平衡处理报告,组间变量事后检验报告Pairwise Comparisons(Posthoc)
• 交互作用图报告Profile Plots
重复测量方差分析结果显示,a与b交互作用显著,F()=,p<0.05,交互作用图如图1。简单效应结果显示,a1在b1(M=,SD=)和b2(M=,SD=)上有显著差异,F()=,p<0.05;a2在b1(M=,SD=)和b2(M=,SD=)上有显著差异,F()=,p<0.05。a的主效应显著,F()=,p<0.05;b的主效应显著,F()=,p<0.05。
回归分析
• 数据要求看Collinearity Diagnostics检验共线性,Casewise Diagnostics检验outlier
Condition Index(15,30),不允许有outlier
• R2结果报告Model Summary-
• R2 > 75% 很好; 50-75% 不错;25-50% 一般; <25% 不够
• 模型总效应报告ANOVA
• Beta、b结果报告Coefficients
以a,b,c为自变量,用逐步回归方法对d进行分析。回归的拟合度良好,R2adj=,模型的总效应F()=,p<0.005。当其他变量恒定时,a与d有正相关,beta=0.653,其效应边缘显著,t()=,p<0.005。c和d对学习动机无显著影响。回归方程为d=Beta*a+b。
聚类分析
• 树状图报告Dendrogram
• 分类结果报告Cluster Membership
聚类分析结果显示,被试按因素a分类结果树状图如图1:
被试按因素a分类结果如表1:
主成分分析
• 看KMO and Bartlett's Test
Bartlett球形检验显著;KMO>0.6
• R的特征值和贡献率报告Total Variance Explained
• 碎石图报告Scree plot
• 主成分载荷报告Component Matrix
• 因子旋转结果报告Rotated Component Matrix
R的特征值和贡献率如表1。根据Kaiser准则,取特征大于1的a为主成分,其积累贡献率达到c%,基本包括了全部指标所包括的信息。取前n个特征值,计算主成分载荷。由主成分分析的结论,对因子载荷阵实行方差最大旋转,可将m个指标分为n类,结果如表2: