1992年出版的斯坦福系列成就测验(Stanford
Achievement Test Series)由斯坦福早期学校成就测验第三版(Stanford
Early School Achievement Test -3,SESAT
-3)、斯坦福成就测验第八版(Stanford
Achievement Test -8,SAT~8)和斯坦福学业技能测验第三版(Test
of Academic Skills-3,TASK
-3)组成。这三套测验都是团体施测的综合成就测验,其中SESAT
-3适用于幼儿园儿童至一年级的学生,SAT一8适用于一一九年级的学生,TASK
-3适用于九——十三年级(社区学院)的学生。
(一)测验的构成
斯坦福系列成就测验共包括20个分测验,分为13个水平,每个水平有5—13个分测验。这些分测验是:
声音和字母:用于评估受测者识别字母,将读音与字母相匹配的能力。
单词学习技能:用于评估受测者对单词的解码技能以及识别声音与字母的相互关系的能力。
辨认单词:让受测者将听到的或看到的单词与某一张图片相匹配,评估他们认识单词的能力。
词汇:主试先说出定义,要求受测者选出最符合定义的单词来。该分测验用于评估受测者的词汇知识。
理解句子:让受测者将某一张说明句子意思的图片找出来,评估他们对句子的理解。
阅读理解:让受测者阅读短文并回答短文下面的问题,评估他们对字面的理解和引申意义的理解。
听单词和故事:用于评估记住细节,听从指令,认识因果关系,抓住中心思想,
理解语言结构的能力。
听力理解:用于评估加工所听到的信息的能力。
语言艺术:用于评估理解和运用语言技巧,组成完整句子的能力。
语言技巧:用于评估有关大小写及标点符号的知识,对语法规则的运用等。
语言表达:用于评估运用字词、短语和从句的技能。
研究技能:用于评估在调查研究过程中所用到的各种技能。
拼写:用于评估正确拼写单词的能力。
数学:用于评估数字概念、数学计算和应用的能力。
数字概念:用于测量对基本的数字概念的理解。
数学计算:要求受测者解答某些计算题。
数学应用:评估受测者将数学技能用于解决实际问题的能力。
科学:测量受测者对生物学和物理学的概念和现象的理解,以及探究的能力。
社会科学:用于评估受测者在地理、历史、政治学、人类学、社会学、经济学等课程的学习中所学到知识和技能。
环境:用于评估有关自然环境和社会环境的概念。
SESAT-3主要包括声音和字母、辨认单词、阅读理解、数学、听单词和故事、环境等分测验。
SAT-8主要包词汇、阅读理解、研究技能、数学、拼写、语言、科学和社会科学、听力技能等分测验。
TASK-3主要包括词汇、阅读理解、语言、研究技能、拼写、数学、科学和社会科学等分测验。
(二)施测和记分方法
如果评估者只实施几个最基本的分测验,各个水平所需的时间大约为1小时45分钟至5小时不等;如果实施全套测验,各个水平所需的时间在2小时15分钟至6小时之间。
斯坦福系列成就测验的原始分数要转换成年级当量、标准九分数、百分等级和各种标准分数。
(三)常模样本的抽取
该测验的修订者在1991年的春季和秋季,用分层随机抽样的方法抽取了19万名学生作为该测验的常模样本。分层变量包括地区、社会经济地位、社区类型(城市与农村)、学校类型(公立与非公立)等。在这些分层变量上的人数比例基本符合1990年美国人口普查的统计数据。
(四)信度和效度
修订者检验了斯坦福系列成就测验在每个水平上的内部一致性和复本信度,所得的内部一致性系数大多数分布在0.
85一0.90之间,复本信度系数分布在0.71一0.95之间。
由于斯坦福系列成就测验的题目是由学科专家、测量学专家和有经验的教师共同编制的,并在不同的文化群体中试用过,因此,它们具有一定的内容效度。在测验使用手册中修订者还报告说,这组测验的原始分数随着年级水平的提高而提高,与斯坦福成就测验第七版及其他标准化的成就测验有中度到高度的相关,这些数据都表明这组测验具有较高的构想效度和效标关联效度。
(五)评价
斯坦福系列成就测验是一组团体施测的标准化成就测验。所评估的内容领域范围很广。常模样本很大而且比较有代表性。其信度和效度已达到测量学的基本要求。该测验有专门为视觉障碍和听觉障碍学生制定的常模,因此可以用来对这些特殊学生做有效的评估。