加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

行为表现评估:一种新的教育评估方法

(2008-04-22 15:56:27)
标签:

论文

评价

【 标 题】行为表现评估:一种新的教育评估方法
【 作 者 】王小慧
【作者简介】王小慧,华东师范大学心理学系(上海 200062)。
【内容提要】通过分析一种新的教育评估方法――行为表现评估,并与传统的纸笔测验的比较,总结出行为表现评估的特性与优势。同时从测量的角度提供了评估的具体方法,并且分析了此方法在实际应用中存在的问题,为教师培训提出了可供参考的建议。
【关 键词】行为表现评估/准则参照测验/系统观察法/检查表/评定表
【 正 文 】
中图分类号:G449 文献标识码:A 文章编号:1008―0627 (2000)02―0008―04
行为表现评估日益受到教育学家与测量学家的重视。它为教学评估提供了一种新的方法、一种新的思想,指导教师如何更科学、更合理地评价学生在学业上的进展情况。行为表现一词原主要用于工作中、人们的生产实践中,而在教学中很少使用。以往的教育评估多采用纸笔测验的形式,包括多重选择、填空、匹配等具体的格式,注重的是学生的学习结果而不是学习的过程,因此人们常常会怀疑传统的测验是否能真正测量到学生对知识的理解、掌握情况,经过长期的探索,寻找到了能真正对学生作出科学评价的方法即行为表现评估。
一、行为表现评估的兴起
行为表现评估是建立在对传统的测验批判的基础上的,1992 年,Herman等人列举了传统评估方式的不足:
1.测验的内容关注于低水平的知识、孤立的内容与技能;
2.测验仅测出结果,没有考虑学习者的思维与问题解决技能;
3.客观的格式,如多重选择题并不能测量出学习者在真实的世界中应用理解的能力。
确实,目前的评估似乎只注重学生对已学知识的回忆与再认,而不能真正测量出学生是否掌握学科各知识点之间的内在联系,更不能测量出学生对某些知识的应用能力。
行为表现评估兴起的第二个推动力就是准则参照测验的兴起。准则参照测验不同于常模参照测验,它是根据界定明确的内容范围来评估学生的行为表现。而常模参照测验则是将学生与所属的总体进行比较,确定个体在群体中的位置,并不能判定个体对知识的掌握程度如何。尤其对于资格考试来说前者更具优势。行为表现评估也关注于对某一内容领域的掌握,注重对学生的行为进行研究,它与准则参照测验具有某些相同的特点,所以准则参照测验的发展促进了行为表现评估的兴起。利用具体知识进行评判,这样更能结合所教授的内容,更客观地反映出学生的学业成就,也可找出学生所缺失的知识点。
二、美国的发展情况
在50年代早期,教育测量专家就论述了行为表现评估,但80年代,美国才大量开展行为表现评估。具体涉及写作、科学、艺术与历史等学科,这一评估旨在更好地进行诊断与课堂教学。自80年代中期,有40多个州采用写作的样例的评估方法代替传统的多重选择的方法,以此来评量儿童的写作能力。在80年代末期,至少有9 个州已采取州立法来规定评估,要从标准化的测验转向行为表现评估。1989年,纽约实施了小学自然科学行为评价测验(ESPET),旨在改变教师教与学生学的方法。当时有将近200000名四年级学生参加了ESPET,他们分别来自4000 所公立与非公立学校。许多州主要开展幼儿与学龄前儿童的行为表现评估。在国家层面上,新标准方案(New Standards Project )也尝试使用行为表现评估,并建议国家教育目标委员会使用此方法于国家教育考试系统之中。为提高实施的可行性、专业的可信性、公众的接受性、法律的辩护性以及经济的承受力等,行为表现评估在不断的实践应用中不断地发展与完善。90年代初期,学术界对这一方法的研究极为活跃。其中代表人物有Gronlund,Haertel,Mehrens等,他们对行为表现评估进行了科学的界定,分析评估的方法与步骤以及在应用中存在的一些问题。1998年,Gronlund将行为表现评估又细分为局限的行为表现评估与扩展的行为表现评估,它们在任务的现实性以及复杂性上存在很大的差异。[1]
三、行为表现评估的界定以及特性
界定Gronlund将行为表现评估界定为:评估要求学生实际完成某任务或一系列的任务,如编故事、演讲、做实验、操作机器等,从中表现出他们在理解与技能上的成就。也就是从学生的行为表现而不是A、B、C、D等的答案来分析学生的掌握情况。另外,还有两个术语,实证评估与可选择的评估。实证评估是行为表现评估的一种名称,强调将理解与技能应用于真实世界情景中的真实问题。可选择的评估也是行为表现评估的一种名称,它强调在评估方法上提供传统的纸笔测验之外的评估方法。这三个术语的互为替代使用,可力求在真实的情景中测量出学生的行为表现。
Herman提出与传统的纸笔测验相比,行为表现评估至少有下述三个优点[2]:
1.涉及较高水平的思维与问题解决技能;
2.它们可引发在真实世界中的应用;
3.让学生表现出创造、设计或做某些事情。
评估注重过程以往的测验仅注重结果,其实许多心理活动、认知活动相当复杂,往往结果虽同,但途径却不同。而且要发现学生的学习困难、学习障碍,必须对过程加以认真的剖析。同时有些行为不会有很清晰的结果,所以更要进行过程评价。比如在演讲、朗读、操作实验仪器、弹奏乐曲以及各种身体活动(打网球、溜冰、跳舞等)中,需要进行行为表现评估。
过程性的测量也成为心理测量的一种趋势。因为人们认识到光依据结果评价来得出结论、作出解释并不符合真实的情况,不能诊断出真正的问题。现在的智力测验也偏重过程性的测量。他们认为,只有通过对过程进行评价才能完成真正意义上的评价。Das提出了PASS模型,并以此为基础编制了智力测验,它就注重对认知过程的测量。Bloomer 所编制的学习测验也注重对过程的测评。其实,对过程的评估是很难的,在此过程中必须合理组织、精巧设计,否则从测验中不会得到有效的信息。评估涉及情景的安排、准则的限定、标准的确定,这些都对教师、评估者提出了很高的要求。此外,过程性评估可体现受测者的个体性,能增强评估者与受测者之间的互动关系,从而可以深刻地探察出学生的成就水平。
当然,有的情况下则要结合使用过程性的评价与结果性的评价。比如,化学实验要求一步一步地按照规范操作,同时它也要求最后的实验结果。许多领域内的评估在最初阶段强调过程的准确性,以后才会强调结果的质量。有时在后期阶段也需要过程评价,因为要保证结果的质量,就必须要对过程加以严格控制。
总的来说,在下列情况下行为表现必须关注于过程性评估:[3]
1.行为表现中没有结果,或结果评价是不可行的(如不存在或太浪费了);
2.过程是有序的,可直接观察;
3.正确的过程对以后的成功相当重要;
4.过程步骤的分析有助于提高结果的质量。
评估多元化人们常常说“一张试卷定终身”,或许这话言过其实,但说明我们的评估形式过于单一,仅仅以标准化的试卷作为评分工具。有时甚至以某次测验分数来评估,有时虽加入平时成绩与出席率,但评分体系不是很合理。这样进行评估的话,就不可避免地要受到考试焦虑、环境与身体等偶发因素的影响。若以这些受影响的考试成绩来评定学生的成绩就不能算得上是真正意义上的测量,违背了测量的客观性。所以要采用多元指标加以评定。多元指标可以包括:注意学生的平时作业、阶段考试及观察学生参与团体活动的能力、应对具体事物的知识等。在评分之前。先规定每一指标所占的权重,然后每一指标的分数乘以权重,最后求总和得到一个综合的分数。这样可以减少一次测验所带来的误差,同时也可找出学生问题发生的某些原因,如家庭作业的分数低于课堂作业,可助于老师进一步探明问题真正的原因。
根据下面的例子(见表1 )可以采用多元指标得到一个综合的评分系统,同时也可以加入评定的日期,以便从时间的角度作出分析与评定,可以体现出学生的发展变化。
表1 成绩指标与权重举例
成 分 权 重
家庭作业 15%
目标测验 20%
行为表现评估 20%
文 件 夹 20%
课堂作业 15%
笔 记 10%
总 计 100%

评估范围扩大笔纸测验的不可避免的缺陷就是仅测量了学生对知识的记忆与回忆,涉及的几乎都是陈述性的知识。采用行为表现评估则可以测量到较高级的认知活动,批判性的思维、问题解决的技能,使学生能综合所学的概念、规则,并将它们灵活地应用到实际的问题解决之中,从而提高学生分析问题、解决问题的能力。
另一方面,评估范围不仅局限于认知领域,还可以评估学生的情感与社会技能。克罗里达的Aurora公立学校制定了12个年级学生所要达到的学习结果与指标。其中,主要分为5个方面:自我指导的学习者、合作的工作者、复杂的思考者、优质产品的生产者、社区的服务者。每一方面都列出了具体的学习结果,以合作的工作者为例[4]:
1.将自己看作团体中的一员,监控自己的行为;
2.评估与团体的功能;
3.互相交流;
4.考虑到个别差异。
只有对过程进行评价才会获得上述例子中的具体的信息,因为传统的测验根本无法体现出学生的在社会交往以及情绪体验上的发展情况。
评估行为具有现实性心理测量往往是间接的测量,这已成为大家的共识。长期以来正是受这种思想的影响,测验的编制者试图编制测验来推断出被试者的认知能力。而行为表现评估更注重直接的测量,强调评估内容的现实性,当然不同的内容,其现实性的程度是不同的,所以要按照实际可行的条件如时间、经费等来确定行为表现的现实程度。目前,经济管理专业的学习中,出现案例分析,让学生通过对案例的分析,对管理环节出现的问题进行判断,这种题型总比让学生回答“什么是科学的管理?”或选择出科学管理的核心内容来得更为有效。若要提高行为表现的现实性则要让学生直接参加管理实务。有的评估过程中可采用模拟情景的方法让学生按要求作出反应,这样既可达到评估的目的又可以引发学生的兴趣。其实教育的最终目的还是要让学生运用所学的知识解决实际问题,若学校的评估与现实工作的要求差距过大,则不能为社会提供它所需要的人才。
四、评估方法
系统观察法对于简单的行为表现,我们可以进行非正式的观察,如,观察儿童握笔的姿势,但对于复杂的行为表现,缺乏系统的观察会使我们丧失重要的信息。如一个5岁儿童几乎每天都要哭一次,而父母却不知道儿童哭的原因。这是由于他们缺少对儿童的系统、仔细观察,不知道儿童的欲求。在观察的同时,我们要借助于检查表或评定表所列举的情况进行观察。观察学生如何完成任务,学生的坚持情况、工作的努力程度等。同时要作好记录。简洁地描述重要的情况,包括所观察的行为、行为发生的情景以及对事件的解释等。观察作为一种科学的研究方法,可应用到行为表现评估中来为进一步的评价、诊断、治疗安置提供丰富的信息。
检查表检查表一般列出行为或结果特征的测量维度,并且判定“是”或“否”。也就是要求教师勾出学生评估过程中表现出的行为。具体的设计步骤列举如下:
1、列出要评价的过程或结果特征;
2、如果要诊断出较差的行为,可增加常见的错误;
3、按逻辑顺序排列(如步骤的顺序);
4、提供指导,留出空格以便核查项目;
5、如果需要,可在结束之前留些空格让教师发表意见。
评定表评定表与检查表是很相似的,但他不是做是否回答,而是要求对行为的质量、频率等进行评分(比如经常、一般、从不等)。它的设计具体步骤如下:
1、列出所要评价的过程或结果特征;
2、选择评定的数字,数字通过描述性的术语界定;
3、对项目排序,以方便使用;
4、提供简洁的指导语,告诉评定者如何使用量表;
5、可在最后附上空格,让评定者发表意见。
当然评定的方法还很多,可按照具体的评估内容与实际的可行性加以选择。
五、结论与启示
行为表现评估是教育评估的一种新趋势。它可以在真实的情景中测量学生对所学内容的掌握情况,可以测量到高级的认知活动,注重测量的直接性与真实性,从而使得评估更为科学、更为合理,尤其是它促进了知识的应用。教学中存在的一个问题是学生所学的理论与实际脱节,而行为表现评估可成为联结两者的纽带,可以使学生深入理解所学的知识,并能紧密联系实际。
以往的评估仅仅是学生独立地对测验题目作出反应,形式比较单调、机械。而行为表现评估则允许学生团队合作,齐心协力,老师也参与其中,并对学生提供指导或作出评判,这样使师生的互动关系从教学阶段延伸到评估阶段。这种评估形式对学生具有吸引力,可以充分调动学生的自主性与积极性,并为他们创造才能的施展提供便利。
行为表现评估也有些不足,比如:比较费时间,不同的老师评判、引导等差异会很大;对教师的要求比较高,教师需要对学生表现出的多样化的行为灵活地作出反应;评估前教师也需要花时间、精力去构思出生动的评价情景。无论是评估前的准备还是具体的评估,都是很艰巨的任务,所以需要对教师进行方法的培训,让他们结合各自学科的特色深入地开展行为表现评估。

【参考文献】
[1]Norman E Cronlund. Assessment of student achievement [M]. Massachusetts: Allyn & Bacon, A Viacom Company,1998.
[2]Paul Eggen & Don Kauchak. Educational Psychology[M]. NewJersey: Prentice―Hall Inc. Simon & Schuster, A Viacom Company, 1997.
[3]Noman E Cronland. How to make achievement tests andassessments [M]. Massachusetts: Allyn and Bacon, A Division of Simon & Schuster Inc,1993.
[ 4] Gary D Borich & Martin L Tombari. Educational Psychology[M]. New York: Addison ―Wesley Educational Publishers Inc, 1997.
【原文出处】宁波大学学报:教育科学版
【原刊期号】200002
【原刊页号】8~11

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有