国际学生评价项目(The
Programme International Student Assessment,简称PISA
)是由经合组织(OECD)发起组织实施的,以15岁年龄为取样,通过对阅读素养、科学素养和数学素养三个领域的测试以便于各国进行比较的国际性比较评价项目。同时,也为各成员国政府研究制定教育政策提供参照。国际学生评价项目第一次在2000年进行测试,有经合组织成员国中的28个国家和巴西、俄罗斯联邦等4个非成员国参加,共计32个国家的265000名学生接受测试,以后每三年进行一次,2000年测试重点为阅读素养,2003年、2006年将分别以数学与科学素养为测试重点。本文拟就科学素养的界定、测评的内容、评估结构等方面作简要介绍和分析,以期对我们能有所启发和借鉴。
一、PISA对科学素养的界定
科学素养是应用科学的知识来确定问题,得出(或提出)基于证据的结论的能力,以便理解并帮助做出关于自然世界的决定,并且通过人类的活动做出调整。
在PISA的上述定义中有以下几个方面需要进一步予以说明,以便更好的理解其内涵。
①“科学知识”不仅指事实、名称、术语的知识,还包括对重要科学概念的理解以及科学知识的局限和作为人类活动的科学的本质。
②“问题”是指那些经过科学的探究能够解决的问题,以及特定问题的科学方面。
③“基于论据得出的结论”是指知道应用选择评价信息、数据的方法,同时需要对已有的信息进行有意识的小心的推测,因为需耍正确判断是否存在足够的信息来得出正确的结论。
④“理解并帮助做出决定”包含以理解自然世界本身作为目标,强调科学的理解有助于做出决定,但并不能够直接导致决定。因为,现实的决定通常是在具有社会的、政治的、经济的背景等情境中出现的,且科学的知识通常是在与社会的、政治的、经济的有关的人的价值观背景下予以应用的。因此,在价值观不同的地方,对科学论据的选择和使用可能会导致争议。
⑤“通过人类的活动做出调整”是指出于人类的目的和结果对于自然世界做出的有计划或无计划的调整。它强调对于人的科学素养的评价,不能简单使用有或无的两分法,而应是多和少的评价
基于以上的认识不难看出,PISA不仅强调科学的知识以及这一知识得以发展的过程对于科学素养是至关重要的,而且认为这二者应是合二为一的
二、科学素养测验的内容
基于以上对科学素养的认识与界定,PISA将从三个角度对科学素养进行评估。
第一,科学概念。PISA认为概念是使我们将新经验与已知的知识联系起来,使我们弄清新经验的意思,并有助于我们弄清自然和人类世界的知识。因此,PISA主要根据以下四个标准来选择受评估的科学概念
①应是与每天日常生活、事物相关的内容。因为,科学概念在人们每天的日常生活中的作用程度是各不相同的。例如,虽然相对论对各种长度、质量、时间和速度的各种关系做出了一个较为精确的解释,但是,牛顿定理对我们每天遇到的力和运动的解释则会提供更有力的帮助。因此,相比较而言我们将更侧重于选择对牛顿定理的理解作为评估的内容。
②必须选择与未来十年乃至更长的时间的生活有关联的科学概念和内容。
③所选择的必须应该是与科学素养可以被认证的相关内容。
④所选择的概念必须与被选择的科学方法相联系,而不能仅仅是书面上的或曾被提出的某种含义。
以下是PISA根据这四个标准确定的主要评估的科学主题,以及与这些科学主题相关的一部分概念。
对以上科学概念的评价,PISA要求这部分内容应主要来源于生命和健康科学、地球和环境科学、技术科学三大领域的运用。值得注意的是,虽然这些概念比较接近于有关物理、化学、生物科学及地球和空间科学,但PISA着重测试的是那些将被用于解决现实生活的科学问题,而不仅仅是理论。因此,它强调对某些特定现象的了解并通过人类的行为加以改变的。
第二,科学方法。PISA认为与收集论据的能力相比,使用科学知识以得出基于充分论据的结论的能力更为重要。为此,PISA更多地关注与科学相关的方法,而不是科学内的方法。这主要包含对得出科学结论的论据的认识、解释以及在此之上采取行动的能力。具体而言,PISA的科学方法应包含以下5种能力。
A.科学地确定可研究的问题的能力。这包括确认可被特定调查证实的问题或观点;辨别出可以通过科学探究来回答的问题,或更明确地揭示某一问题在某一情境下是可以进行科学的探究。
B.确定科学的观察所需要的论据的能力。它是指确定哪些信息对某一观点的有效验证是必须的。例如,我们需要确定或辨认应比较哪些事物,变量应如何变化或控制、需要什么附加信息,为收集相关数据应采取何种行为。
C.得出或评价结论的能力。这包括从给定的信息、数据中产生结论,或者从某一范围内选择适用于数据的结论;根据提供的数据来支持或反驳某一结论,或者确定在得出结论过程中提出的假设。
D.传播(交流)有效的结论的能力。即将有效的结论用适当的方法清晰地传递给特定人群。其中,这些结论的形式是基于特定的情境和数据,或是基于相关的附加信息。
E.论证对科学概念的理解的能力。即指在特定的情境下,运用适当的观点论证对科学概念的理解。包含解释可能导致既定变化的原因及各种关系,或者做出关于既定变化的作用的决定,或者使用没有给定的科学观念或信息确定影响既定结果的因素。
这里值得注意的是,以上这五个方面,就前四个方法而言并未对测试者的科学知识的储备有任何特殊的要求,它们的主要目标在于对被评价者在运用收集、评估、联系有效科学证据等方面的能力做出评价。当然,没有任何一种科学方法可以是在“完全无知”的状态中进行的。在第五个方法中,主要是对相关的科学观念的理解的评价,理解是主要的障碍。
第三,科学情境。PISA认为要准确地进行评价,决定和控制(预期的)情境的作用范围是很重要的。由于PISA的目标是评价学生在数年义务教育的末期,他们运用所学知识和技能的能力。因此,PISA要求必须将项目设置在现实生活的情境中,而不仅仅局限于学校。并将科学情境选择的重点放在个人和家庭(个人的)、社区(公共的)、世界生活(全球的)、与说明科学知识是如何产生的及科学知识如何对与科学相关的社会起决定作用(历史相关性的)等四个层次。关注的焦点是那些与个人、家庭及社会公众有关的事物。数据亦主要与人们的生活有关,来源于个人或私人的情境以至于更宽的公众中,有时还包括全球的范围。将评价任务设置在这些情境中,PISA希望能够做到尽可能准确地评价学生在科学课程中所获得的科学知识的运用能力(虽然有些知识可能来自其它学科或者根本不是来自校内)。
三、评估结构
PISA基于这样两个目的设计其评估结构。其一,应使任务尽可能地真实,并在一定程度上反映现实生活的复杂性;其二,应有效地使用测试时间,使用较少的情境,即就提供的一个情境提出几个相关的问题,而不是就一个情境提出一个问题。因此,在形成评估结构时,被PISA确定为具体评估任务的将由一系列项目所构成,每一个项目都是与一些最初的或最基本的刺激物相联系,其中一个任务里的项目将评价多个科学方法和多个科学概念,同时,每一个项目评价表1中的一个科学方法,各个项目独立计分。但是值得注意的是,PISA将不包括亲自实践的任务,至少在2000年、2003年科学素养的次要调查年里是这样的。下面就PISA的评估结构作简要介绍。
1.主要准备考核的相关能力
第一,科学地确定可研究的问题,并将科学知识运用于现实生活相关领域中的能力。
第二,在科学调查中确认证据的能力。
下面以一项题为“停止病菌”的考核内容中的两个问题,来具体说明对以上两个能力的评价。
被试者被要求阅读一篇关于免疫系统研究历史的精炼短文。
问题1要求有一个建构性的回答,学生要根据其在答案里出现的有关细节的数量为成绩计分,以2、1、0三个等级计分。(得2分的要求是给出“弄破皮肤并将脓汁直接注Aafit管将有助于提高对天花的免疫力”这一答案。)这一项目评估的目的在于,评估被试者科学地确定可研究的问题和使用人类生物知识应用于生命与健康的科学领域的能力。
问题2同样以2、1、0三个等级对被试是否提及所有信息点予以计分(如是否提及没有经过Boyston's治疗的生存机率以及得到治疗的病人是否被天花感染等信息点。〕以此评估被试者使用人类生物知识应用于生活和健康的科学领域的能力,及在科学调查中确认证据的能力。
第三,得出或评价结论的能力。值得注意的是,PISA不仅要求回答同意或不同意,而且更加重视其原因必须与所提供的信息保持一致。即如果被试者只写同意或不同意是不给分的,只有给出原因、提供相关的信息才给分。
第四,对科学概念的理解,并给出建构性回答的能力。
下面以一个测验试题为例,说明对以上两项能力的评价。
要求被试者阅读一篇澳大利亚道路研究委员会的Peter
Cairney提出的文章。在该测验试题中,刺激物就是这篇文章。
问题4主要评价第三个能力,即在技术科学领域使用力和运动知识的能力,评价学生得出结论和评价结沦的能力。但只写同意或不同意不给分,只有给出原因、提供相关信息才给分,例如,同意是因为如果车子即使在快速行驶时,仍保持靠近路边,冲撞的可能性将被减少;如快速运行时,被追尾的可能性也将减少。或不同意是因为如果车子运行快速并保持相互之间一样的距离,这可能意味着他们没有足够的空间在紧急状态下停止。
问题5主要评价在技术科学领域对有关力和运动的科学概念的理解。这要求一个建构性的回答,根据是否提及重要的信息点来评分,计分为2、1、0分。(参考答案是:a.一辆车开得较快时,其冲力也就更大,因而需要更大的阻力来停止它;b.在同一时间一辆车开得较快的车停下会比开得较慢的车滑出更远的距离。)
2.测验中的分布比例
第一,科学方法的分值分布的建议。
从以上的分布比例可以看出,PISA更多地倾向于评价对科学概念的理解,对其它科学方法的评价则显得较为次要。需要说明的是,这一分值的分布比例在2006年科学素养作为主要评估内容时,可能将会被重新修订。
第二,在生命、健康科学;地球、环境科学;技术科学三个应用领域中其分值将各占30-40%,大致呈平均分布状态。
第三,在情境选择方面,PISA将着眼于将项目分散在四个已经认可的情境即个人、社区、全球、历史性的情境中。在任务中所呈现的情境将被定为刺激物,它有可能是一篇短文,或带有表格、图解、曲线图、图形之类的文章。通过应用科学概念到应用领域来展示对科学概念理解的能力,所要求的反映将与情境、刺激物里呈现的应用领域相关。在2000年的科学素养测评中,多数的任务是以书面的形式呈现,但是,在2006年以科学素养为测评重点时,将可能考虑使用其它形式的刺激物。
3.等级的记录
为了达到PISA的目标,需要确定学生成就的发展等级。为此,PISA建立了以下科学素养等级。
第一,在熟悉的情境下,能够使用较容易掌握的科学概念,并能做到以下几个方面:
①辨认一些能否被科学探究决定的问题;
②在一个变量变化而另一个受控制的情境下,为了验证某一观点或探索某一问题,确定必须获取的信息;
③在变量本应受到控制却没有被控制的情境下,回答为什么结论或观点可以是没有条理的;
④用一种可被人理解的方式将论据与结论联系起来,提出一些主要观点;
⑤根据易于理解的概念进行预言和阐释原因。
第二,在更复杂的情境下,能够运用更高认知要求的概念,并做到以下几点:
①认识到所有科学理解、科学事例都是暂时的,具有前进性,他们有助于对以前所学知识的复习及更好地理解;
②在复杂的情境下,确定为验证某一观点或探索某一问题而必须收集的信息及条件;
③鉴定支持某一观点的论据的适用性,支持或反对与复杂联系下的有用论据相关的观点、结论;
④使用所提供的科学知识、数据、信息,形成一个支持或反驳某一特定结论的建构性的观点;
⑤基于对科学概念的更复杂、更抽象的理解,进行预测和解释。
这一等级记录还较为粗略,在2006年如果有足够的时间来测出学生对科学概念和科学运用领域的综合掌握程度,将得出科学概念的理解的次等级。科学素养标准的具体情况将产生于从领域判断中得出的结论分析。这些具体情况表明,如何对问题进行归类,及在不同观点上是如何分布的,经验性的数据将被用来验证发展等。这将使各国科学教育的理想目标与现实成果缩小差距,并从中受益。
总之,PISA的科学素养的界定与测评,反映了西方发达国家对科学教育的理解,体现了科学教育的发展方向,值得我们研究学习和借鉴。
参考文献:
1.OECD (1999 ) ,
Measuring
Student
Knowledge
and
Skills:A New
Framework for Assessment,OECD
Publications
Service,2,rue Andre
–pascaI,75775
Pads Cedex 16,France.
2.OECD
(2000),Measuring Student Knowledge and
Skills:The
Pisa 2000 Assessment of Reading, Mathematical and
Scientific Literacy, OECD Publications Service,2,rue
Andre-pascaI,75775 Pads Cedex 16,
France.
3.OECD(2001), Knowledge and Skill for
I,ife:first
Results from PISA 2000,OECD Publications Service,2,me
Andre-pasca1,75775 Paris Cedes 16,France.
注:本文作者为福建师范大学教育科学与技术学院王晞
黄慧娟
许明,原载于《上海教育科研》2004.4
加载中,请稍候......