加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

教学设计中的评价技术

(2010-12-18 18:11:41)
标签:

教育评价

教学设计

教育

一.         定义教学评价

1.1   教学设计中评价的历史发展

    最早的教学设计模式主要是由来自经验科学领域的心理学家和培训人员负责开发的。这些模式的一个基本成分是评价。收集有关新设计的教学有效性的数据和信息对于确证设计过程和修改教学是十分重要的。

    上世纪50年代的美国,教育革新的评价通常包括使用实验和控制组的研究设计。在试验结束后进行检测以确定接受了教学的实验组是否明显好于未接受教学的控制组。这种方法被用来确定新教学革新如教育电视和计算机辅助教学的有效性。在这些研究中,把经由革新传递的教学的效果同主要由课堂教师传递的“传统教学”的效果进行对比。这类评价主要目的是要确定所开发的革新的价值。

    上世纪60年代,美国进行了一场重大的课程改革,投入数百万美元来开发新的教科书及新的教学方法。当新的教科书出版后,传统的评价方法就启动了,也就是把学习新课程的学生的表现同学习传统课程的学生的表现进行对比。虽然有一些结果模棱两可,但很明显,很多使用新课程的学习学到的东西很少。

    20世纪60年代末和70年代初,关于评价在教育中的作用的讨论达成了一个共识:在把教科书分发给用户之前需要进行某种进行的评价。评价的目的不是为了确定教科书的价值,而是要确定在发行之前应如何改进。在评价的这个阶段,主要关注的是学生学得如何、他们是否喜欢教学、他们对教学的反应如何。但是这些信息被用来令教学更有效,而不是对教科书的好坏下一个总的结论。

    20世纪60年代后期和70年代初期发表的教学设计模式都包括评价成分。大多数模式包括形成性评价和总结性评价的区分,并建议:从把教学材料的初稿给学习者学习到获取学习者在检测中的行为表现和对教学的反应的数据的全过程,教学设计人员都应该参与到其中去。这些信息和数据为修改提供了资料。

    早期教学模式所讨论的评价过程包括两个重要特征。第一个特征是,测验应当集中于所陈述的教学目标。这就是所谓的参照标准或目标参照测验。第二个特征是,主要根据从学习者获取的数据来进行教学决策。

 

1.2   定义评价

    教育心理学和评价领域的领军人物Michael Scriven 在他的《评价词典》(Evaluation Thesaurus) (Scricen, 1991)中给出了一个正式的评价定义:

    评价是确定事物的优点、价值和重要性的过程,评价的结果就是由此过程所获得的成果。(p.139)

Scriven以优点(merit)一词来表示“被评价对象的内在价值”,以价值(worth)一词来表示被评价对象的市场价值或者说它对各有关利益方、组织或其他集体所具有的价值,以重要性(value)一词来表示评价明确地涉及到价值判断。

    Scriven(1980) 的“评价的逻辑”包括四个步骤。第一,选择判断优点或价值的标准。第二,设定具体的行为标准(即要求的行为水平)。第三,收集有关行为表现的数据以便把观察到的行为水平同行为标准要求的行为水平进行比较。第四,在评价中必须作出价值判断。简言之,评价就是确定关于优点和价值的标准,设定行为的标准,收集数据,作出价值判断。

 

1.3   教学评价

    教学评价是指以教学目标为依据,按照一定的规律,运用一切有效的手段,对教学活动的过程及结果进行测量、衡量,并给以价值判定的活动。它是教学设计的重要组成部分,是教学过程中必不可少的重要环节。(陈琳,2006)

    由此可以看出教学评价具有以下几个明显特征;①从本质上看教学评价是一种对教与学过程和资源的价值判断。②教学评价应当以教学目标为依据,明确的教学目标是搞好教学评价的前提。③教学评价的目的是促进学生的发展。

    一般来说,教学评价应当具有多重功能,这些功能可以概括为一下几个方面:诊断功能、反馈功能、激励功能、教学功能。

    一般认为,当前国内外教学评价的发展具有一下的新特征:①重视发展,淡化甄别与选拔,实现评价功能的转化。②重综合评价,关注个体差异,实现评价功能指标的多元化。③强调质性评价,定性与定量相结合,实现评价方法的多样性。④强调参与和互动、自评与他评相结合,实现评价主体的多元化。⑤注重过程,总结性评价与形成性评价相结合,实现评价重心的转移。⑥重视教育技术在教学评价中的应用。

 

二.         教学评价技术

    教学评价技术就是评价者为了完成教学评价的任务,收集学习过程和学习资源中的相关数据或证据,并对其进行处理和判断所采用的方法和手段。了解不同的评价技术将有助于获得有效而全面的数据,并得到客观的结论。一般来说,常用的教学评价技术有两种:实绩评估和笔纸测验。

 

2.1实绩评估

    Swanson、Norman和Linn (1995)提出的“真实性评估”是实绩评估的同义词。他们将实绩评估定义为“通常借助需要被试花费大量时间才能完成的开放性任务,测评将被试在真实情境中他们真正使用的复杂、高层次知识和技能。”(P.5)。包含在这种类型中的评估包括观察、开放式问题、微观世界、论述题、模拟、项目和档案袋。

    Linn(1994)提出了评价实绩评估充分性的严格标准。这个标准包括效度、评估后果、直接性、透明度、公平性、迁移性和概括性、任务的认知复杂性、内容质量、内容涵盖度、意义、成本和效率。

 

2.2笔纸评估形式

    第二种主要的评估类型是笔纸评估。这是我们通常所认为的“测验”。因为现在这种评估通常在网上进行,因此,笔纸评估这个术语或许会让人产生误解。这种类型的评估有多种测题形式:选择题、判断题、配对题、填空题和简答。

    一般的,所有这些测题形式都有一个确定和相对少的正确答案。借助一定想象力和创造力,我们可以将选择题、配对题和简答题用在陈述性知识、智慧技能、态度、认知策略和动作技能的评估上。

笔纸评估可以用三种不同的形式来设计:回忆、再认和建构性回答。

 

三.         形成性与总结性评价

3.1什么是形成性与总结性评价

    教学评价出现在教学设计过程的两个不同的位置,服务于两个不同的目的。在一个位置上,设计者对材料进行评价以确定教学存在的不足,以至于能够做出修改,使这些教学材料更为高效。然后设计者就知道他的教学材料是否恰当或者知道自己是否需要继续设计过程。这种评价被称为形成性评价。在另一个位置上,在教学材料已经运用到它们所设计的教学情境之后,为了向那些可能采用或者继续使用材料的决策者提供数据,设计者可能会涉及按照材料的效用来评价这些材料的过程。这就是所谓的总结性评价。

    下面是Scriven(1967)对形成性评价和总结性评价的定义:

    形成性评价是为了支持教学设计过程的改进而进行的评价,通常委派或由能对设计做出改进的人来评价。总结性评价就是另一种评价,在评价目的方面,它是由观察人员或决策者来进行的评价,这些人需要了解评价结论,但并非为了用这些结论来改进开发过程。

 

3.2形成性评价

    形成性评价包括以下七个步骤:

    ①设计评估。为了在任何材料的真正开发之前作出修改,设计的每一个阶段的输出—目标、学习者和情境分析、任务分析等都应该经受形成性评价。这种评价可能在设计的每一阶段完成之时执行。它们用来证实每一阶段设计过程的精确性。

    ②专家评估。设计者让具有学科知识的专家检查教学材料内容的准确性与完整性。一个不错的主意是把专家的意见分成三类:应该直接作出哪些修改,在接下来的阶段中应该收集哪些数据,以及应该忽略的建议。

    ③一对一评价。在一对一评价中,设计者将教学材料在两到三名目标受众成员身上试验。这一阶段的目的是确定和修改教学中存在的明显错误的问题,包括:印刷上的错误、不清晰的句子、低质量或缺失的说明书、不恰当的例子、生僻的词汇、标错页码或插图、没有表明意图的例证、顺序错误的框架等。

    ④小组评价。这一阶段的目的是为了检验以一对一评价数据为基础的修改的有效性,确定教学如何对不同的学习者起作用,并且审视在缺少设计者干预时教师如何更好的教学。

    ⑤实地试验。这一阶段的目的是为了:确定在小组评价中作出的修改是否有效;确定在实际教学环境中实施这些材料可能引发的各种问题;证实试用于大量目标受众样本的教学能否可靠的预测教学的效用。

    ⑥即时评价。

    ⑦设计形成性评价方案。Tessmer(1993)建议评估方案要包括下列成分:学习目标、资源和限制性条件分析、任务分析、学习环境描述、需要回答的问题、提供证实答案的指标和评估方式、确定需求评估的教学部分、执行的形成性评价阶段以及每个阶段需要回答的问题。

    在这七个阶段中,早期设计阶段所做的决策经受着检验。分析教学中学习者遇到的问题并相应地修改教学。设计者应该尽可能实施评价的多个阶段,这样可以确保有质量的产物。然而,如果评价时间个财力有限,那么至少要进行一对一评价。

 

3.3总结性评价

    评估者执行总结性评价是为了确定教学项目的效果,看它能否解决需求评估中确定的教学问题。教学和培训领域中目前运用的两种总结性评价方法是:客观主义方法和主观主义方法。客观评价依赖实证主义,它根据观察和数据来回答问题,通常会用到科学方法:建立假设,设计实验来控制无关变量,收集数据和作结论。主观评价运用专家的判断作为评价的标准,常运用质性方法,如用观察和访谈考察教学情境。

    总结性评价包括七个步骤:确定目标,选择导向,选择设计,设计或选择评价标准,收集数据,分析数据,报告效果。在执行总结性评价时,评价者可能要评估是收益结果、学习结果、态度结果、项目实施水平和成本。除了以目标为基础的评价,评价还可能包括非目的性结果评估。这种目标自由的评估运用自然的、探索性的技术进行评价,诸如以非标准化为基础的观察、访谈和对现存材料的考察。

 

四.         项目评价的模式

    20世纪七十年代美国学者开发了许多评价模式。一些新的模式被用于项目的评价,这些项目包括大量的开发工作、多种组织和代理机构以及各种形式的教学传递。这些项目往往有大量的预算和许多工作人员,通常集中在大学里。这些项目要实现多重目的。

    这些项目要往往采用了新的评价模式,或许那个时代最有影响的模式就是Stufflebeam(1971)的CIPP评价模式,是情境(context)、输入(input)、过程(process)、产品(product)的首字母组合。这是个分开的评价,可以在一个综合评价中进行全部四个评价,也可以单独进行。CIPP在今天仍然是一个流行的评价模式。

    情境评价要求对革新运用的环境进行评估,以确定革新的需要和目标,以及影响革新成功的环境因素。

    第二个构成成分是输入评价。这一步的评价问题主要是关于可用于开发和执行革新或项目的资源方面的问题。这类评价主要用于考察在项目运行过程中会发生什么或应该发生什么事情,在进行有关项目架构的决策时特别有帮助。

    第三个构成成分称为过程评价。这一步跟设计者进行的形成性评价很接近。过程评价主要用于考察革新开发的方式、实施的方式、其最初成果以及需要进行的修改。

    第四个构成成分是产品评价,这很像是总结性评价,因为它要评估的是革新在预定的环境中是否产生了预期的结果。产品评价包括详述项目的结果、测量在项目目标中说明的结果、确定非预期的结果、评估项目的有点、进行成本-效益分析或者投资回报评估。

    CIPP模式是一个重要的模式,因为它扩展了评价者的作用,包括了环境评价和需求评价、输入评价、实施或过程评价,还有传统的总结性或产品评价。

 

五.         Kirkpatrick的四级培训评价模式

    Kirkpatrick提出这一模式的目的是想激发培训主管认清评价的重要性,更多致力于对培训项目的评价。换句话说,Kirkpatrick特别为培训的评价开发了一种模式。他最初提出的步骤后来改称四个层次(四级)。评价者可能只开展前面几个步骤的评价,也可能开展所有四个层次的评价。

    第一级:反应。评价的第一级是评估学习者对其学习经验的反应或态度。主要采用匿名问卷的形式来了解学习者的真实反应。通常的假设是,如果学习者不喜欢教学,那么就不可能学有所得。

    第二级:学习。第二级评价的目的是要确定培训项目参与者学到了什么。Kirkpatrick(1998)用学习一词表示“作为参加项目的结果,参与者改变态度、增进知识、增加技能的程度”(p.20)。学习结果可能包括知识、技能和态度的改变。第二级评价应当重点测量培训活动所涵盖的内容,强调具体的学习目标。知识的测量通常采用成就测验(旨在测量个人在接触特定的学习经验后所增长的知识的测验),技能的测量主要采用行为测验(即要求被测者表现出一些真实生活中的行为的测验情境),态度主要采用问卷进行测量(即由研究参与者填写的自我报告式的数据收集工具,旨在测量培训活动要改变的目标态度)。第二级评价应该在培训活动后即可进行以确定参与者在培训活动中是否获得了预期的知识、技能、态度。

    第三级:行为。此时评价者的目的在于确定作为培训的结果,培训参与者是否改变了在工作中的行为(OJB)。要确定学到的知识、技能、态度是否用在了工作中以及运用情况如何,通常需要跟学习者以及他们的上司、同伴和下属进行联系。Kirkpatrick似乎比较满意使用回顾性调查设计(提出若干同现在相关的过去的问题)来测量培训的迁移。

    第四级:成效。此时评价者的目的是要找出培训是否得到了“最后的成效”,最后的成效应包括积极的投资回报的财务成果,包括影响组织绩效的任何结果。第四级的就更多为延时效果而非即时效果。学习者在培训中获得的行为应该导致组织方面的改变。

    Kirkpatrick的模式非常有用,因为它把评价的应用扩展到了工作场所的绩效。Kirkpatrick的模式跟用来解决组织中绩效问题的绩效技术的主要概念是一致的。

 

六.            参考文献

[1] Scriven, M. (1991). Beyond formative and summative evaluation. In M. W. McLaughlin& D. D. Phillips (Eds.), Evaluation and education: At quarter century (pp.19-64). Chicago: University of Chicago Press.

[2] scriven, M. (1980). The logic of Evaluation. Inverness, CA: Edge press.

[3] 陈琳. 现代教育技术[M]. 北京:高等教育出版社,2006.

[4] Swanson, D. B., Norman, G. R., & Linn, R. L. (1995). Performance-based assessment: Lessons from the health Professions. Educational Researcher, 24(5), 5-11, 35.

[5] Linn, R. L. (1994). Performance assessment: Policy promises and technical measurement standards. Educational Researcher, 23(9), 4-14.

[6] Scriven, M. (1967). The methodology of evaluation. In R. W. Tyler, R.M. Gagne, & M. Scriven (Eds.) Perspectives of curriculum evaluation (pp.39-83). Chicago: Rand McNally.

[7] Tessmer, M. (1993). Planning and conducting formative evaluations. London: Kogan Page/ Taylor & Francis.

[8] Stufflebeam, D. L. (1971). Educational evaluation and decision making. Itasca, IL: F. E. Peacock.

[9] Kirkpatrick, D. L. (1998). Evaluating training programs: The four levels. San Francisco: Berrett-Koehler.

[10] R. A. 瑞泽、J. V. 邓普西,王为杰 等译. 教学设计和技术的趋势与问题(第二版)[M]. 上海: 华东师范大学出版社, 2008.

[11] 张剑平. 现代教育技术(第二版)[M]. 北京:高等教育出版社, 2006.

[12] P. L. 斯密斯、T. J. 雷根,庞维国 等译. 教学设计(第三版)[M]. 上海:华东师范大学出版社, 2008.

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有