第六章 第二节 总体平均数的估计
(2013-04-21 20:15:46)| 分类: 教育技术学~~ |
|
第六章 |
|
第二节 |
|
母总体平均数μ的最佳点估计,是取自该总体的样本平均数 。通过样本的 估计总体平均数μ,首先假定该样本是随机取自一个正态分布的母总体,或非正态总体中的n>30的样本。而计算出来的实得平均数 ,是无数容量为n、均值为 中的一个。这样,便可根据样本平均数的分布理论,对总体均数进行估计,并可用概率对其不确定性加以说明。因为样本平均数的平均数与母总体的平均数相同(μ =μ),故对平均数总体的平均数进行估计就是对母总体平均数的估计。 一、总体平均数估计的计算步骤 (一)根据实得样本的数据,计算样本的平均数与标准差。 (二)计算标准误 。有两种情况: 1. 当总体方差σ2已知时, (公式5—11)(n为样本容量。这时样本的方差S2不用) 2.
当总体方差未知时,用样本的不偏估计方差即
计算
,如果计算的是样本的有偏估计方差S2则
(三)确定置信间距或显著性水平。这在对总体平均数μ进行估计之前,根据需要确定。统计学上一般规定显著性水平为.05,即置信水平为0.95或显著性水平为.01,即置信水平为0.99。因为.05或.01的概率事件属于小概率事件。而小概率事件被认为在一次抽样中是不易被抽到的。也就是说,眼前所抽取的这个样本的平均数,不大可能是属于样本分布尾部端的很少可能出现的那个样本。因而据此样本的平均数对总体参数进行估计则犯错误的可能很小(不超过5%或1%的概率)。 (四)根据样本平均数的抽样分布,确定查何种统计表。确定α=.05或.01的横坐标值。一般当总体方差已知时,查正态表;当样本方差未知时,查t值表(当n>30时,也可查正态表作近似计算)。确定Zα/2与tα/2 (即以分布曲线两尾部端计算的置信度的搬率,因是两尾部端,故写作α/2) (五)确定并计算置信区间:
±Zα/2 ,Z(1-α)/2是查(1-α)/2 概率所得到的Z的分数值。 置信区间可写作: - Z(1-α)/2 <</SPAN>μ<</SPAN> + 或: - Zα/2 <</SPAN>μ<<SPAN style="POSITION: relative; TOP: 2pt;
mso-text-raise: -2.0pt"> + 如果查t值表,则写作 - t(1-α)/2 <</SPAN>μ<<SPAN style="POSITION: relative; TOP: 2pt;
mso-text-raise: -2.0pt"> + 或: - tα/2 <</SPAN>μ<<SPAN style="POSITION: relative; TOP: 2pt;
mso-text-raise: -2.0pt"> + (六)解释总体均数的置信区间。估计总体均数落入该区间的正确可能性概率为1-α,犯错误的可能性概率为α。 二、总体方差σ2已知时,对总体均数μ的估计 (一)当总体分布为正态时,不论样本n的大小,其标准误 都是,这时样本的方差S2在计算中没有用处。依据上面所讲的步骤,查正态表,确定Zα/2,一般情况下显著性水平α确定为.05或.01,因此其Zα/2为1.96或2.58。这两个数值最好记牢,可以省略查正态表的一步。 (二)当总体为非正态分布时,只有当样本容量n>30以上,才能根据样本分布对总体均数μ进行估计,否则不能进行估计。 [例1] 解:此题总体分布为正态,σ2已知,故无须计算样本方差。其标准误为: 用nl=10的样本估计总体参数μ: .95的置信区间:78—1.96×2.24<</SPAN>μ<78+1.96×2.24。 73.6<</SPAN>μ<82.4 .99置信区间:78—2.58×2.24<</SPAN>μ<78+2.58×224 解释:从一个分布为正态,均数为μ的总体中,每次抽取n= 10的样本无限多个,其中有一个样本的 =78,在这无限多个样本 中,其中有95%的样本平均数在μ±1.96 之间。但μ并不知道是多少,而只知道一个样本 为78,故可推理;任何一个样本平均数±1.96×2.24,包含μ在内的可能性概率为0.95,也就是说78±1.96×2.24包含即说μ在73.6—82.4之间的可能性为 95%,或者说,估计可能在73.6—82.4之间,估计正确的概率为.95,估计错误的概率为.05,因为有5%的样本平均数±l.96×2.24的区间内不包括μ在内。 同理,根据n=36的样本进行估计得: .95的置信间距:79—1.96×1.18<</SPAN>μ<79+1.96×1.18 76.6<</SPAN>μ<81.3 .99的置信间距:79—2.58×1.18<</SPAN>μ<79+2.58×1.18
根据同一总体的两个不同的样本进行估计,样本大时估计的区间小,其样本平均值也更接近总体均值。因此遇到有多个样本的:情况时,一般取样本大的均值与标准误对总体进行估计。即在条件允许的情况下,应用大样本进行观测,对总体参数μ进行估计更具优越性。 [例2] 解:此题是方差已知,但成绩分数的分布是什么未知,一般情况下学习成绩分布为非正态的居多。暂按非正态分布对待,n>30;符合条件,可进行推论。所求真实成绩即指μ。 定置信水平为.95,查正态表得Z(1-α)=1. 96。 故:85—1.96×0.71<</SPAN>μ<85+1.96×0.71 即据此次成绩推论该班某科成绩的真实分数在83.6—86.4之间,估计正确的概率为0.95,错误的概率为0.05。 三、总体方差σ2未知,对总体平均数的估计 总体方差未知,用样本的无偏方差( )作为总体方差的估计值,实现对总体平均数μ的估计。因为在总体方差未知时,样本平均数的分布为t分布,故应查t值表,确定tα/2或t(1-α)/2。有两种情况: (一)总体的分布为正态时,可不管n之大小。 (二)总体分布为非正态时,只有n>30,才能用概率对其样本分布进行解释,否则则不能推论。 心理与教育科学研究中经常遇到的是这种情况下对总体参数μ进行推论的问题。 [例3] n1=10, =78,S1=8,n2=36, =79,S2=9,问其总体参数μ的.95置信间距是多少? 解:求标准误, .95的置信间距: 据n1=10的样本计算,需查t值表上df=10—1一栏,得 t.05/2=2.262
据n2=36的样本计算,需查t值表上df=36—1一栏,得
tα/2=2.042(因t值表中没有df=35的表列值,故取近似值,本自由度为35,取df=40 以上两样本的n大小不等,估计的区间长度不同。显然,样本较大的置信估计具有更大优越性:置信区间长度小,样本 更接近μ。 上题中,由于n>30时t分布渐近正态分布,故亦可用Zα/2代替tα/2作近似计算,这样可免去查表的麻烦。结果为76<</SPAN>μ<82,与用t.05/2(35)计算的结果相差甚微。 总体方差未知时,查t值表所求总体参数的置信区间的解释,与正态分布的解释相同:计算结果总体参数μ有95%的可能性落在75.9—82.1之间,意味着作总体参数在75.9—82.1之间的结论时,估计正确的概率为95,错误的概率为.05。 |
|
|

加载中…