加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

【课标解读】《课标解读》第十章  统计与概率内容分析(一)

(2015-05-05 11:48:20)
标签:

宠物

分类: 前沿聚焦

《课标解读》第十章  统计与概率内容分析(一)

 

稿源:2011版《义务教育数学课程标准解读》

作者:2011版课标解读专家组

 

 

 第十章统计与概率内容分析

统计与概率的内容在新课程中得到了较大重视,成为了和数与代数、图形与几何、综合与实践并列的四部分内容,而统计则成为这一部分内容的重点。统计的核心是数据分析,“数据是信息的载体,这个载体包括数,也包括言语、信号、图像,凡是能够承载事物信息的东西都构成数据,而统计学就是通过这些载体来提取信息进行分析的科学和艺术”

 

第一节 统计与概率课程的内容主线

如前所述,核心概念是理解数学课程的基本线索,《标准》中将数据分析观念作为了核心概念,为理解这部分内容的主线提供了重要指导。在《标准》中,将数据分析观念解释为:“了解在现实生活中有许多问题应当先做调查研究,收集数据,通过分析做出判断,体会数据中蕴涵着信息;了解对于同样的数据可以有多种分析的方法,需要根据问题的背景选择合适的方法;通过数据分析体验随机性,一方面对于同样的事情每次收集到的数据可能不同,另一方面只要有足够的数据就可能从中发现规律。数据分析是统计的核心。”基于这些阐述,可以将统计与概率课程的内容主线确定为如下几个方面。

 

    一、数据分析过程

使学生树立数据分析的观念,最有效地方法是使他们投入到数据分析的全过程中去。在此过程中,学生将不仅仅学习一些必要的知识和方法,同时将体会数据中蕴涵着信息,提高自己运用数据分析问题、解决问题的能力。

为此,《标准》在三个阶段都提出了相应的要求,这也成为了统计内容的首要主线。在第一学段中,提出“经历简单的数据收集和整理过程”;在第二学段中,提出“经历简单的收集、整理、描述和分析数据的过程(可使用计算器)”;在第三阶段中提出“经历收集、整理、描述和分析数据的活动,了解数据处理的过程;能用计算器处理较为复杂的数据”。从这些要求中不难看出:

第一,数据分析的过程可以概括为:收集数据、整理数据、描述数据和分析数据。

第二,学段的要求逐步深入。从第一学段到第三学段,随着年龄的增长,学生将逐步经历更加完整的数据分析过程;在要求上第一学段、第二学段都提出了经历“简单的”过程,第三学段则去掉了这个限制。第三,从第二学段开始使用计算器来处理数据,第二学段可以使用计算器来处理数据,第三学段则要求能使用计算器。

下面,我们以《标准》的例子来进一步体会这条主线的内涵及要求。在三个学段,《标准》都举了对全班同学的身高进行分析的例子,并且鼓励学生把每年测量身高的数据都保留下来,根据不同学段的特点对于数据进行整理、描述和分析,提取信息,从而经历数据分析的过程。具体阐述和要求如下。

[案例1] 三个学段中对于数据分析过程的例子

第一学段(《标准》例19):对全班同学的身高进行调查分析。

[说明] 学校一般每年都要测量学生的身高,这为学习统计提供了很好的数据资源,因此这个问题可以贯穿第一学段和第二学段,根据不同学段的学生特点,要求可以有所不同。希望学生把每年测量身高的数据都保留下来,养成保存资料的习惯。在第一学段,主要让学生感悟可以从数据中得到一些信息。

第二学段(《标准》例38):对全班同学的身高的数据进行整理和分析。

[说明] 在上面的例子中,已经引导学生对全班同学的身高的数据进行初步分析。在这个学段中,要求学生结合以前积累的身高数据,进行进一步的整理,然后进行分析。整理的目的是为了便于分析,例如,条形统计图有利于直观了解不同高度段的学生数及其差异;扇形统计图有利于直观了解不同高度段的学生占全班学生的比例及其差异;折线统计图有利于直观了解几年来学生身高变化的情况,预测未来身高变化趋势。学生还可以讨论用什么数据来代表全班同学的身高,自己的身高在全班的什么位置。

第三学段(《标准》例70):比较自己班级与别的班级同学的身高状况。

[说明]对于两个班级学生身高状况比较,通常可以通过平均值来判断,但有时候仅仅通过平均数是不够的,如果一个班同学之间身高差异很大,而另一个班同学之间身高差异很小,即使前一个班的平均高一些,也不能说这个班的整体状况很好。因此,在判断身高状况时,不仅要看平均值,还需要参考方差。

进一步,可以引导学生逐渐深入地进行数据分析,可以要求学生把身高分段,画出频数直方图,并引导学生讨论,通过直方图是否能得到更多的信息。

 

二、数据分析方法

掌握必要的收集数据、整理数据、描述数据和分析数据的方法,无疑是统计课程内容的第二条主线。

1.收集数据的方法

在收集数据方面,所涉及的数据可能是全体的数据(总体数据),也可能是通过抽样获得的数据(抽样数据)。在第一、第二学段中,学生收集的基本都是总体数据;而在第三学段中,学生将开始学习抽样,体会抽样的必要性,通过实例了解简单随机抽样。

数据的来源有两种,一种是现成的数据,一种是需要自己收集的数据。在义务教育阶段两种来源都应该让学生有所体验,特别是自己收集的数据。常用的收集数据方法包括调查、试验、测量、查阅资料等。学生应该对收集数据的方法都有比较丰富的体验。为此,《标准》在第一学段提出了解调查、测量等收集数据的简单方法;在第二学段提出会根据实际问题设计简单的调查表,能选择适当的方法(如调查、试验、测量)收集数据”“能从报纸杂志、电视等媒体中,有意识地获得一些数据信息

2.整理、描述、分析数据的方法

当人们收集了一堆数据以后,这些数据往往看起来比较杂乱,这就需要来整理数据,在不损失信息的前提下,对看起来杂乱无章的数据进行必要的归纳和整理,然后把整理后的数据运用统计图表等直观地表示出来,并加以适当的分析,为人们作出决策和推断提供依据。

在第一学段,学生将学习分类的方法,分类是整理数据和描述数据的开始。在此基础上,能用自己的方式(文字、图画、表格等)呈现整理数据的结果,而不学习正式的统计图表或统计量。这一点与以往不同,也是非常重要的。有研究表明,早期经验的多样化,有助于儿童建立进一步学习的经验和兴趣。在此基础上通过对数据的简单分析,体会运用数据进行表达与交流的作用,感受数据蕴涵信息

在第二学段,学生将学习条形统计图、扇形统计图、折线统计图等常见的统计图,并且能用它们直观、有效地表示数据。第二学段还将学习一个重要的刻画数据集中趋势的统计量——平均数。

在第三学段,学生将了解频数和频数分布的意义,能画频数直方图。继续学习刻画数据集中趋势的统计量——中位数和众数,以及刻画数据离散程度的统计量——极差、方差。并且体会样本与总体关系,知道可以通过样本平均数、样本方差推断总体平均数、总体方差。

需要指出的是,教学中应鼓励学生运用所学习的方法,尽可能多地从数据中提取有用的数据,并且能够根据问题的背景选择合适的方法,而不是单纯地名词、计算方法等的掌握。这里不妨看一下《标准》中对于案例38的说明:条形统计图有利于直观了解不同高度段的学生数及其差异;扇形统计图有利于直观了解不同高度段的学生占全班学生的比例及其差异;折线统计图有利于直观了解几年来学生身高变化的情况,预测未来身高变化趋势,因此需要我们根据问题的背景选择合适的统计图。总之,统计学对结果的判断标准是好坏’”[2],而不是对错

 

三、数据的随机性

我们知道,推断性数据分析的目的是要通过数据来推测产生这些数据的背景,称这个背景为总体。我们假定总体是未知的,我们的目的是通过样本来推断总体。而在调查或者实验之前,我们不可能知道数据的具体取值。也就是说,数据可以取不同的值,并且取不同值的概率可以是不一样的,这就是数据随机性的由来。

在《标准》中将数据随机作为了数据分析观念的内涵之一。数据的随机主要有两层涵义:一方面对于同样的事情每次收集到的数据可能会是不同的;另一方面只要有足够的数据就可能从中发现规律。举一个《标准》中的例子(例40):袋中装有若干个红球和白球,一方面,每次摸出的球的颜色可能是不一样的,事先无法确定;另一方面,有放回重复摸多次(摸完后将球放回袋中,摇晃均匀后再摸),从摸到的球的颜色的数据中就能发现一些规律,比如红球多还是白球多、红球和白球的比例等。再举一个案例(例22),学生记录自己在一个星期内每天上学途中所需要的时间,如果把记录时间精确到分,可能学生每天上学途中需要的时间是不一样的,可以让学生感悟数据的随机性;更进一步,让学生感悟虽然数据是随机的,但数据较多时具有某种稳定性,可以从中得到很多信息,比如,通过一个星期的调查可以知道“大概”需要多少时间。

不少老师有这样的一个困惑,概率也是研究随机现象的,那么为什么又提出数据的随机性呢?实际上,统计与概率都是研究随机现象的学科。不论怎么说,机遇(或说偶然性)无所不在,机遇伴随着人的一生(当然随人的情况而有异),这是一个无法回避的现实[3]。统计与概率正是从不同的角度研究如何刻画随机现象,统计侧重于从数据来刻画随机,概率侧重于建立理论模型来刻画随机。鼓励学生运用数据来体会随机,更能体会随机的特点。下面是课程标准修订组组长史宁中教授的回答 [4]

“我听了一些课,老师们经常这样处理:比如对于掷一枚均匀的硬币,先得到出现正面或反面的概率是1/2,然后让学生通过反复掷硬币去验证这个结果(1/2)。这里有两个问题。第一,一个硬币,先假定它出现正面和反面的可能性是1/2,这是数学(或者称为概率)。这个1/2是通过概率的定义得到的,不是依靠掷硬币验证出来的。实际上,学生做了很多次实验也得不到1/2,反而更加糊涂了。第二,运用定义的方式教学随机,不能很好的培养学生的随机观念。

需要指出的是,我们赞成做实验,赞成运用统计的思想来做实验。统计是通过数据来获取一些信息,来帮助人们做出一些判断。同样是掷硬币的问题,在统计上就会这样设计实验:先让学生多次掷硬币,计算出现正面的比例(频率),然后用频率来估计一下出现正面的可能性是多大。如果这个可能性接近1/2的话,就推断这个硬币大概是均匀的,这是统计的思想。

对于先给出定义,教师往往比较习惯,而对于“逆过来”通过数据来进行推断,教师往往比较陌生。为了帮助大家理解,再阐述一下摸球的例子。同样是一个袋子里有5个球,4个白球、1个红球,如果让学生通过摸来验证出现白球的可能性是4/5、出现红球的可能性是1/5,这不是统计。统计是这样的,告诉学生们袋子里有很多球,有白颜色的和红颜色的。让孩子们去摸,摸到一定程度的时候,学生发现摸出白球的次数比红球的次数多,由此推断袋子里白球可能比红球多。进一步的话,能推断出白球和红球的比例大概是多少。再告诉球的总数的时候,能够估计出来几个白球和几个红球,这个是统计的过程。

我并不是反对前一种教法本身,而是说如果这么教,蕴含的随机思想并不强,学生也不感兴趣,都知道了概率为什么还要做实验。而后来的这种教法,学生体会到每一次摸的结果事先都不知道,但是摸多了能够帮助我们做一些判断。这样一来,学生既体会了随机,又感受到了数据中蕴含着信息,我想这种类似于“猜谜”的活动学生也会很有兴趣”。

实际上这种“猜谜”绝不是“瞎猜”,在《标准》案例40的说明中给出了这种推断背后的科学依据,也就是虽然不能保证估计得完全一致,但能保证在一定实验次数下,估计值与实际情况相差不大的可能性是很大的。

在第三学段,学生开始学习抽样,体会样本和总体的关系,这实际上也是帮助学生体会数据的随机性的重要内容。同时,《标准》还利用案例阐述了在第二学段、第三学段的不同要求。在上面提到的摸球游戏中,在第二学段“通过摸球,学生发现每次摸出的球的颜色不确定,初步感受数据的随机性。进一步通过统计摸出红球和白球的数量,可以估计袋中是白球多还是红球多。在不确定的基础上,体会规律性”。在第三学段“在第二学段的基础上,学生可以估计袋中白球数量和红球数量的比,进一步体会规律性。教师可以进一步鼓励学生思考:给出了袋中两种颜色球的总数,如何估计白球和红球各自的数量”。另外,在第三学段,《标准》还提出了“通过表格、折线图、趋势图等,感受随机现象的变化趋势”,并给出了案例71。案例71刻画的是变量之间的随机关系,即年份与GDP是有关系的,但这种关系是不确定的。因为描点呈现线性增长趋势,可以进一步引导学生利用直线来表示这种趋势。教学中,可以鼓励学生尝试大致画出这条直线,比如有的学生会根据直线两侧的点要基本相同来描出此直线,并由此预测未来经济发展,感悟一些随机现象的规律性。对于直线方程如何求得,则不做要求。

 

四、随机现象及简单随机事件发生的概率

在这次课程标准修订中,学生在第一学段中将不再学习概率,主要理由是在基础教育阶段统计的重要性是大于概率的,发展学生的数据分析观念是这部分内容的核心。即使对于随机的学习,如前所述,《标准》中也提出运用数据分析来体会随机性。从第二学段开始,《标准》安排了概率的学习,并且根据学生年龄特点,第二学段称为“随机现象发生的可能性”,第三学段称为“事件的概率”。

在概率学习中,帮助学生了解随机现象是重要的。在义务教育阶段,所涉及的随机现象都基于简单随机事件:所有可能发生的结果是有限的、每个结果发生的可能性是相同的。在第二学段,要求学生“了解简单的随机现象的实例,能列出简单的随机现象中所有可能发生的结果”,并“能对一些简单的随机现象发生的可能性大小作出定性描述”。在第三学段,要求“能通过列表、画树状图等方法列出简单随机事件所有可能的结果,以及指定事件发生的所有可能结果,从而了解并获得事件的概率”;同时,知道“通过大量地重复试验,可以用频率来估计概率”。

 

第二节 具体内容分析

 “统计与概率”的主要内容有:收集、整理和描述数据,包括简单抽样、整理调查数据、绘制统计图表等;处理数据,包括计算平均数、中位数、众数、极差、方差等;从数据中提取信息并进行简单的推断;简单随机事件及其发生的概率。

实际上,数据分析可以分为描述性统计分析和推断性统计分析。描述性数据分析是通过集中趋势、离散程度、图形表示等对来刻画数据;而推断性统计分析是利用样本的数据去推测总体的情况。由此可见,第一、二学段学生主要学习的是描述性统计分析 [5],第三学段开始接触推断性统计分析。为了使老师们对于这部分的主要内容有全面把握,下面将三个学段进行整体介绍。

 

一、抽样和简单随机抽样

抽样是第三学段统计课程的一个重要内容。如前所述,推断性统计分析是利用样本的数据去推测总体的情况,在第三学段学生将对此进行初步感受。

首先,学生需要在实际问题中体会抽样的必要性。进一步,如何抽样获取“好”的数据呢?所谓“好”的数据是指那些能够更加客观地反映实际背景的数据。为了获取好的数据,我们需要尽可能多地利用对于实际背景已有的了解。如果对于实际背景一无所知,那么,一定要随意抽取样本,保证每个个体被抽到的概率相同,这便是“简单随机抽样”。对于简单随机抽样,《标准》要求通过实例加以了解,并在下面的案例中给出了具体要求。

[案例2](《标准例67》): 设计调查方法。

了解本年级的同学是否喜欢某电视剧。调查的结果适用于学校的全体同学吗?适用于全地区的电视观众吗?如果不适用,应当如何改进调查方法?

[说明] 对于许多问题,不可能、有时也不必要得到与问题有关的所有数据,只要得到一部分数据(样本)就可以对于总体的情况进行估计。很显然,如果得到的样本能够客观地反映问题,则估计就会准确一些,否则估计就会差一些。因此,我们希望寻找一个好的抽取样本的方法,使得样本能够客观地反映问题。在本学段,主要学习简单随机抽样方法,这是收集数据中通用的方法,在一般情况下,我们都假定样本是通过随机的方法得到的。

因为同一个年级的学生差异不大,采用简单随机抽样方法比较合适。可以在上学时在学校门口随机问讯,也可以按学号随机问讯。为了分析方便,需要把问题数字化,如喜欢这部电视剧的记为1,不喜欢的记为0

对于这样的问题,问讯学生数不能少于20人,取40~50人比较合适,取更多的学生当然更好,但需要花费更多的精力。由此可见,一个好的抽样方法不仅希望“精度高”还希望“花费少”。

假设问讯的学生数为n,记录数据的和为m(显然,m为喜欢这部电视剧的人数),则调查结果说明,学生中喜欢这部电视剧的比例为m/n。我们依此估计本年级的同学中喜欢这部电视剧的比例。

用这个数据估计全地区的电视观众喜欢这部电视剧的比例是不合适的,因为学生、成年人、老年人喜欢的电视剧往往不同。为了对全地区的电视观众喜欢这部电视剧的情况进行估计,可以采用分层抽样方法,比如依据年龄分层,需要知道各年龄段人口的比例,按照比例数分配样本数,而在各个层内则采取随机抽样;或者依据职业分层,等等。教师应该了解分层抽样,在本学段学生只需学习简单随机抽样方法。

 

二、图形表示

统计图是描述数据的重要手段,可以直观地表示数据。在第二学段学生学习的是条形统计图、折线统计图、扇形统计图(在第二学段要求会看,第三学段要求会画);在第三学段学生学习的是频数直方图。其中,条形统计图有利于直观了解不同所代表的数量及其差异;扇形统计图有利于直观了解不同部分占整体的百分比及其差异;折线统计图有利于直观了解变化的情况,预测未来的趋势。频数直方图和条形统计图都可以直观地表示出具体数量,它们的区别主要体现在:第一,条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数,宽度则表示各组的组距,因此其高度与宽度均有意义。第二,频数直方图表示的是连续分组数据,直方图中的各矩形通常是连续排列;而条形统计图表示的是离散数据,各矩形通常是分开排列。第三,条形图是直观地显出具体数据,直方图是表现频数的分布情况。看下面的一个例子 [6]

[案例3] 频数分布

对某一品种的树苗进行调查,随机抽取了100株,测量了树木的直径。测量结果发现:最小直径大于6.5cm,最大直径小于17.5cm。于是从6.5 出发,每隔1cm做一个区间,到17.5正好11个曲线,分别用数字78,…,17表示,再记录直径在每一个区间的树木的株数,得到下列数据(第一个数表示树的直径所在的区间,第二个数表示区间中树木的株数:

72)(85)(98)(1010)(1113)(1226)(1312)(149)(158)(164)(173

将上面的数据制成频数直方图(如图1),这样就可以直观地看出在哪个区间的树木比较多,可以分析数据的取值规律,比如在图1中的数据呈现“中间多、两边少、基本对称”的趋势。在图1中,我们还能比较清晰地判断出,有50%以上的树苗的直径是在10.5cm12.5cm之间,这是很重要的信息,因为这个信息告诉了数据大体的取值范围。

 

1

对于统计图的学习,提出几点需要注意的:第一,不要急于引入正规统计图的学习,在第一学段《标准》要求鼓励学生用自己的方式来描述数据。第二,在描述数据的过程中,使学生不断体会各种统计图的特点,能根据实际问题选择合适的统计图来描述数据。第三,鼓励学生读懂媒体中的一些统计图表。第四,鼓励学生从统计图中获取尽可能地有用信息。这个问题也是大家普遍困惑的,到底引导学生从哪些方面来读图呢。Curcio (1987 )把学生对数据的读取分为三个水平:(1)数据本身的读取(reading the data),包括用能够得到的信息来回答具体的问题,这些问题图表中有明显的答案。(2)数据之间的读取(reading between the data),包括插入和找到图表中数据的关系。这包括做比较(例如比较好、最好,最高、最小等)和对数据进行操作(例如加减乘除)(3)超越数据本身的读取(reading beyond the data),包括通过数据来进行推断预测推理,并回答具体的问题。在实际教学中,教师已经开始重视鼓励学生尝试由信息来进行预测。但是,在教学中还存在了一些误区。比如,笔者曾经遇到过不止一次这样的案例:如图2,教师鼓励学生根据某女生出生到12岁的身高,由此去预测这个学生15岁的身高(图2到图7中纵轴的身高单位为厘米)。

 

 有的学生(虽然是很少数)脱离了数据去进行“预测”:“我觉得她应该能长到190厘米,因为我希望她去打篮球”。就是基于数据,学生也有五花八门的答案,有的说:“8岁到10岁长了10厘米,10岁到12岁长了24厘米,照这个趋势1214岁要长30多厘米,我估计她到15岁要到2米了”;有的说:“8岁到10岁长了10厘米,10岁到12岁长了24厘米,12岁到14岁又会回到长10厘米,我估计她到15岁快到180厘米”;还有的说:“到12岁就不怎么长了,我估计她到15岁差不多170厘米。”面对五花八门的答案,教师也觉得都有道理,不知如何引导。

    这里需要注意两点。第一,预测需要基于数据。对于脱离数据进行“预测”的学生,要引导他用数据说话,虽然这个预测也有可能,但可能性不会大;第二,有时候为了更合理地预测,需要我们收集更多的数据。教师可以引导学生思考:几个学生的想法都有道理,但是要比较合理地预测,还需要我们掌握更多的信息,比如,可以收集曾经和她差不多情况的人15岁的身高来帮助预测;或者把她与当地女生平均身高进行对比,看看12岁与平均身高的对比情况,由此预测15岁与平均身高的对比情况。当然,无论哪种预测都不能肯定是正确的,但会比单纯依靠这个学生以前的情况进行预测要合理。进一步,如果条件允许的话,还可以鼓励学生实际去做。在这样的思考下,一位老师做了如下的设计:[7]

[案例4]根据统计图来进行“三次”预测

第一次,教师呈现小婷(女生)出生到12岁的身高数据(如图2),鼓励学生预测她15岁的身高。和前面叙述的一样,学生基于这个数据给出了不同答案。

教师没有就此结束,而是给出了小婷15岁的身高,引起学生的反思:“实际上,小婷今年已经15岁了,她的身高是168厘米”,并得到图3

 

 在此基础上再鼓励学生预测小婷18岁的身高。学生发现小婷1215岁增长的幅度不大,由此推断1518岁增长的幅度也会不大。那么是这样吗?有的学生提出可以找一些和小婷情况差不多的女孩,看看她们18岁时的身高。根据学生的想法,教师呈现了如下三个女生的身高(如图,图5,图6)鼓励学生进行第二次预测。  

 

学生发现虽然她们的身高具体数值不同,但1518岁变化趋势却比较一致,增长的幅度都不大,由此可以预测小婷到18岁很可能只比15岁时增长2厘米左右,即她18岁的身高在170厘米左右。还有的同学发现小婷的身高值与图6所表示的女生比较接近,并且比这个女生略矮一些,由此根据这个女生18171厘米预测小婷170厘米。进一步,有的学生提出只有这三个女生的数据是否太少了,不说明一般情况,还可以收集更多的数据。于是,教师给出了北京城市女生平均身高统计图(如图7),鼓励学生进行第三次预测。

 

学生发现这组数据也有这个趋势:1518岁的身高增长的不多,由此预测小婷的身高是170厘米左右。有的学生则根据15岁时小婷的身高比平均身高多6厘米,由此估计小婷18岁时也要多6厘米,所以是169厘米左右。当然,这些预测也并不能保证一定正确。

以上“三次预测”的案例是鼓励学生从数据中获取合理信息的有益尝试,在实践中我们还需要更多的案例,以及如何鼓励学生有效获取信息的策略,这也构成了需要进一步研究的问题。

 

三、集中趋势和离散程度

目前《标准》要求的平均数、中位数、众数,它们都是刻画一组数据集中趋势的统计量。有了这些量,不仅可以表述调查对象的集中趋势,还可以用来对不同的总体进行比较,比如可以比较同一年级不同地区学生的平均身高。对于平均数、中位数、众数的学习,不仅仅要学习如何计算,而且要设计合适的情境,使学生“了解它们是数据集中趋势的描述”。

教师们困惑的问题,这三个量之间到底有什么区别,什么时候该用什么统计量?其实,我们现在处理的数据,大部分是对称的数据,数据符合或者近似符合正态分布。这时候,均值(平均数)、中位数和众数是一样的(如图8)。

 

只有在数据分布偏态(不对称)的情况下,才会出现均值、中位数和众数的区别。所以说,如果是正态的话,用哪个统计量都行。如果偏态的情况特别严重的话,可以用中位数。这也就是我们常说的平均数容易受极端数据的影响。这里不妨看一下《标准》中的例子。

[案例5](《标准》案例68):平均数、中位数和众数

 某个公司有15名工作人员,他们的月工资情况如下表。计算该公司的月工资的平均数、中位数和众数,并分别解释结果的实际意义。

职务

经理

副经理

职员

人数

1

2

12

月工资/

5000

2000

800

 [说明] 平均数、中位数和众数都是刻画数据的集中趋势的方法,因为方法不同,得到的结论也可能不同。很难说哪一种方法是对的,哪一种方法是错的,我们只能说,能够更客观地反映实际背景的方法要更好一些。在这组数据中有差异较大的数据,这会导致平均数较大,因此,用中位数或众数要比用平均数更客观一些。

不难计算出该公司月工资的中位数和众数均为800元。而

月工资的平均数= 加权平均(可以看成是加权平均)

              

因此,加权平均往往就是总体平均,其中的权是数据对应的比例。

[8]

“这说明了进行数据分析时经常使用平均数的理由:使误差平方和达到最小,也就是说利用平均数代表数据,可以使二次损失最小。而利用中位数代表数据,是使一次损失(误差绝对值的和)最小”[9] 。而我们都知道,二次函数有着很好的数学性质,所以人们选择用平均数来进行研究,在义务教育阶段更加注重平均数的教学是有道理的。因此,《标准》在第二学段只安排了平均数的学习,而将中位数、众数的学习放在了第三学段。

只是依赖集中趋势是不足以表述数据特征的,比如分析《标准》中案例68、案例69中的两组数据,这两个公司的月平均工资虽然都是1240元,但显然两个公司的工资的差异是不一样的,由此使学生“体会刻画数据离散程度的意义”。最简单的表述离散程度的量是极差,但它没有考虑中间那些数据所提供的信息。在现代统计学中,经常使用方差来刻画数据的离散程度。有了方差以后,就可以进一步分析两个公司的工资情况。

 

四、随机事件及其发生的概率

1.随机现象的特点及概率的古典定义

概率是研究随机现象的科学。如前所述,在义务教育阶段,所涉及的随机现象都基于简单随机事件:所有可能发生的结果是有限的、每个结果发生的可能性是相同的。

在第二学段,《标准》首先要求“具体情境中,感受简单随机现象的实例”,感受其在相同的条件下重复同样的试验,其试验结果不确定,以至于在试验之前无法预料哪一个结果会出现。在此基础上,“能列出简单的随机现象中所有可能发生的结果”,这里所涉及的现象(类似于案例41)都是比较简单的,学生能够直接列出所有可能发生的结果,并且感受到每个结果发生的可能性是一样大的。进一步,能对一些简单的随机现象发生的可能性大小作出定性描述,并能进行交流。

在第三学段,所涉及的现象相对比较复杂,学生需要通过“列表、画树状图等方法列出简单随机事件所有可能的结果,以及指定事件发生的所有可能结果”。特别地,学生将从对可能性的定性描述,到刻画简单随机事件发生的概率,即定义事件{x=k}发生的概率为:

           

这个定义被称为概率的古典定义。看下面的例子:

[案例6]  小明和小红在做掷硬币的游戏。任意掷一枚硬币两次,如果两次朝上的面相同,那么小明获胜;如果两次朝上的面不同,那么小红获胜。这个游戏公平吗?

在计算概率的时候,学生将运用自己的方法列举所有可能出现的结果。如学生可以分别用正, 反代表硬币的两个面,则可能出现的结果是:

        (正,正),(正,反),(反,正),(反,反)

学生可以列成表:

          

学生可以画出树状图:

 

每种结果的概率都相等,都是1/4,所以两次朝上面相同和不同的概率都是1/2。学生将得到这个游戏对双方是公平的,由此体会概率的意义和作用。

这里需要强调的是,义务教育阶段概率课程更重要的目标是体会概率的意义和作用,而不仅仅是计算一些事件发生的概率。因此,不能将这部分内容处理成单纯计算的内容,而应关注在实际问题中学生对概率意义的理解。至于概率的古典定义学生在具体实例中了解即可,不用一般地给出。

2.频率估计概率

在第三学段中,《标准》还提出了“知道通过大量地重复试验,可以用频率来估计概率”的要求。实际上,随机现象表面看无规律可循,出现哪一个结果事先无法预料,但当我们大量重复实验时,实验的每一个结果都会呈现出其频率的稳定性。学生将在具体的实验活动中,对频率与概率之间的这种关系进行体会,知道大量重复实验时频率可作为事件发生概率的估计值。为此,可以设计下面的活动:

[案例7]1)每人掷一枚均匀的硬币10次,分别记录下正面朝上和反面朝上的次数;

     2)将全班数据逐次进行汇总,并完成图9(用线连接各点):

 

9 硬币正面朝上的频率统计图

3)在图9中,用彩色笔画出表示频率为1/2的直线,你发现了什么?

    4)表1是历史上数学家所做的掷硬币的实验数据,这些数据支持你的发现吗?

1 历史上数学家所做的掷硬币的实验数据

实验者

投掷次数n

正面出现次数k

正面出现的频率k/n

蒲丰

 4 040

 2 048

0.506 9

德 · 摩根

 4 092

 2 048

0.500 5

费勒

10 000

 4 979

0.497 9

皮尔逊

12 000

 6 019

0.501 6

皮尔逊

24 000

12 012

0.500 5

罗曼诺夫斯基

80 640

39 699

0.492 3

 

条件允许的话,还可以在计算器上利用随机数或计算机上模拟掷硬币的实验,以提供大量的实验数据,更好地使学生体会频率与概率的关系。但需要指出的是,利用计算器或计算机模拟概率实验,应建立在学生亲身实践这些实验并获得比较丰富的直观经验的基础上。进一步,可以鼓励学生利用频率与概率的关系解释生活中的一些问题。例如,可以引导学生讨论“明天的降水概率为80%”的涵义,学生通过讨论将知道明天下雨的可能性比较大,虽然有可能明天不下雨,但带伞应是非常明智的作法。还可以根据情况向学生介绍,明天降水概率为80%意味着:在100次类似于明天的天气条件(如气温、湿度、气压)下,历史记录告诉我们,大约有80天会下雨。至于频率稳定在概率的具体数学涵义,不宜作为义务教育阶段学生学习的内容。

在了解了频率与概率的关系后,学生就知道了大量重复实验时频率可以作为事件发生概率的估计值,并可以利用这种方法来估计一些事件发生的概率。看下面的一个例子:

[案例8]小明用瓶盖设计了一个游戏:任意掷出一个瓶盖,如果盖面着地则甲胜;如果盖口着地则乙胜。你认为这个游戏对甲、乙双方公平吗?做一做这个游戏。

这个问题需要全班合作尽可能多地获取实验数据,并分别计算盖面着地和盖口着地的频率,以此确定这个游戏是否公平。学生在实验的过程中,将进一步体会随机现象的特点(某次实验结果的不确定性和大量实验结果的规律性)。

 

 

 

稿源:2011版《义务教育数学课程标准解读》

作者:2011版课标解读专家组

 

 

   (邱廷建转载:《新世纪小学数学网》

 

 

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有