列联表与独立性检验之分类变量与列联表
(2025-09-25 10:45:55)
标签:
教育 |
分类: 教育理论 |
列联表与独立性检验之分类变量与列联表
教材:
在现实生活中,人们经常需要回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题。
在讨论这类问题时,为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量。
高中主要讨论取值于{0,1}的分类变量的关联性问题。
如何利用统计数据判断一对分类变量之间是否具有关联性呢?
对于这样的统计问题,有时可以利用普查数据,通过比较相关的比率给出问题的准确问答,但在大多数情况下,需要借助概率的观点和方法。
对于简单的统计问题,最直接的解答方法是,比较经常锻炼的学生在女生和男生中的比率。
还可以通过建立一个古典概型,使用条件概率的语言,给出另外一种解答,条件概率的直观解释。
为了清楚起见,我们用表格整理数据。
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存。我们将这种形式的数据统计表称为2X2列联表。给出了成对分类变量数据的交叉分类频数。
中间的四个格中的数是表格的核心部分。
对于大多数实际问题,我们无法获得所关心的全部对象的数据,因此无法准确计算出有关的比率或条件概率。在这种情况下,古典概型和条件概率的观点为我们提供了一个解决问题的思路。比较简单的做法是利用随机抽样获得一定数量的样本数据,再利用随机事件发生的频率稳定于概率的原理对问题答案作出推断。
很多统计方法都是基于这种思想建立起来的。
教参:
实际问题——成对分类变量——普查——总体数据——2X2列联表计算比率——确切结论;
——抽样调查——样本数据——2X2列联表独立性检验——,,,
结合丰富的实例,通过问题引导,采取由易到难、逐步深入的处理方式。
注重信息技术与相关内容的有机融合,强调使用计算器、计算机等工具探索和解决问题,例如,在画等高堆积条形图时,借助信息技术作图,不但作出的图形准确美观,而且省时省力。
教科书首先设置问题情境。
例题给出的解答方法也是有缺陷的,为后面引出独立性检验方法作了铺垫。
分类变量的取值表示个体所属类别,例如数学考试等级是分类变量,取优、良、中等、及格、不及格五个值。
列联表是由两个及两个以上分类变量进行交叉分类的频数分布表,教科书中仅涉及两个分类变量的列联表,并且每个变量只取两个值。在教学中,不要求给出概念的严格定义,只需给出描述性的说明即可。
前一篇:越中数学组长教研备课活动安排
后一篇:国庆前后工作安排