加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

第六章 第二节 总体平均数的估计

(2013-04-21 20:15:46)
分类: 教育技术学~~

第六章

第二节      总体平均数的估计  

    

母总体平均数μ的最佳点估计,是取自该总体的样本平均数 通过样本的 估计总体平均数μ,首先假定该样本是随机取自一个正态分布的母总体,或非正态总体中的n>30的样本。而计算出来的实得平均数 ,是无数容量为n、均值为 中的一个。这样,便可根据样本平均数的分布理论,对总体均数进行估计,并可用概率对其不确定性加以说明。因为样本平均数的平均数与母总体的平均数相同(μ =μ),故对平均数总体的平均数进行估计就是对母总体平均数的估计。

一、总体平均数估计的计算步骤

()根据实得样本的数据,计算样本的平均数与标准差。

()计算标准误 。有两种情况:

1. 当总体方差σ2已知时 (公式511)(n为样本容量。这时样本的方差S2不用)

2. 当总体方差未知时,用样本的不偏估计方差即 计算 ,如果计算的是样本的有偏估计方差S2  (公式518)

()确定置信间距或显著性水平。这在对总体平均数μ进行估计之前,根据需要确定。统计学上一般规定显著性水平为.05,即置信水平为095或显著性水平为.01,即置信水平为099。因为05或.01的概率事件属于小概率事件。而小概率事件被认为在一次抽样中是不易被抽到的。也就是说,眼前所抽取的这个样本的平均数,不大可能是属于样本分布尾部端的很少可能出现的那个样本。因而据此样本的平均数对总体参数进行估计则犯错误的可能很小(不超过5%或1%的概率)

()根据样本平均数的抽样分布,确定查何种统计表。确定α=.05或.01的横坐标值。一般当总体方差已知时,查正态表;当样本方差未知时,查t值表(n>30时,也可查正态表作近似计算)。确定Zα/2tα/2 (即以分布曲线两尾部端计算的置信度的搬率,因是两尾部端,故写作α/2)

()确定并计算置信区间   

±Zα/2 Z1-α)/2是查(1-α)/2 概率所得到的Z的分数值。

置信区间可写作:

- Z1-α)/2 <</SPAN>μ<</SPAN> + Z1-α)/2                     (6-2)

或:

- Zα/2 <</SPAN>μ<<SPAN style="POSITION: relative; TOP: 2pt; mso-text-raise: -2.0pt"> + Zα/2

如果查t值表,则写作

- t1-α)/2 <</SPAN>μ<<SPAN style="POSITION: relative; TOP: 2pt; mso-text-raise: -2.0pt"> + t1-α)/2   

或:

- tα/2 <</SPAN>μ<<SPAN style="POSITION: relative; TOP: 2pt; mso-text-raise: -2.0pt"> + tα/2   

()解释总体均数的置信区间。估计总体均数落入该区间的正确可能性概率为1-α,犯错误的可能性概率为α。

二、总体方差σ2已知时,对总体均数μ的估计

()当总体分布为正态时,不论样本n的大小,其标准误 都是,这时样本的方差S2在计算中没有用处。依据上面所讲的步骤,查正态表,确定Zα/2,一般情况下显著性水平α确定为.05或.01,因此其Zα/2196258。这两个数值最好记牢,可以省略查正态表的一步。

()当总体为非正态分布时,只有当样本容量n>30以上,才能根据样本分布对总体均数μ进行估计,否则不能进行估计。

[1]  已知母总体为正态分布,σ=707从这个总体中随机抽取n110n236的两个样本,分别计算出 78 79,试问总体参数μ的.95和.99置信区间。

解:此题总体分布为正态,σ2已知,故无须计算样本方差。其标准误为:

 

 

nl10的样本估计总体参数μ

95的置信区间:78196×224<</SPAN>μ<78+196×224

736<</SPAN>μ<824

99置信区间:78258×224<</SPAN>μ<78+258×224

                             722<</SPAN>μ<838

解释:从一个分布为正态,均数为μ的总体中,每次抽取n 10的样本无限多个,其中有一个样本的 78,在这无限多个样本 ,其中有95%的样本平均数在μ±196 之间。但μ并不知道是多少,而只知道一个样本 78,故可推理;任何一个样本平均数±1.96×224,包含μ在内的可能性概率为095,也就是说78±196×224包含即说μ736824之间的可能性为 95%,或者说,估计可能在736824之间,估计正确的概率为.95,估计错误的概率为.05,因为有5%的样本平均数±l96×224的区间内不包括μ在内。

同理,根据n36的样本进行估计得:

95的置信间距:79196×118<</SPAN>μ<79+196×118

766<</SPAN>μ<813  

99的置信间距:79258×118<</SPAN>μ<79+258×118

                                   76<</SPAN>μ<82

根据同一总体的两个不同的样本进行估计,样本大时估计的区间小,其样本平均值也更接近总体均值。因此遇到有多个样本的:情况时,一般取样本大的均值与标准误对总体进行估计。即在条件允许的情况下,应用大样本进行观测,对总体参数μ进行估计更具优越性。 

[2]    有一个49名学生的班级,某学科历年考试成绩的σ=5,又知今年某次考试成绩是85分,试推论该班某学科学习的真实成绩分数。

解:此题是方差已知,但成绩分数的分布是什么未知,一般情况下学习成绩分布为非正态的居多。暂按非正态分布对待,n>30;符合条件,可进行推论。所求真实成绩即指μ

 

定置信水平为.95,查正态表得Z1-α)1. 96

故:85196×071<</SPAN>μ<85+196×071

                   836<</SPAN>μ<864

即据此次成绩推论该班某科成绩的真实分数在836864之间,估计正确的概率为095,错误的概率为005

三、总体方差σ2未知,对总体平均数的估计

总体方差未知,用样本的无偏方差( )作为总体方差的估计值,实现对总体平均数μ的估计。因为在总体方差未知时,样本平均数的分布为t分布,故应查t值表,确定tα/2t(1-α)2。有两种情况:

()总体的分布为正态时,可不管n之大小。

()总体分布为非正态时,只有n>30,才能用概率对其样本分布进行解释,否则则不能推论。

心理与教育科学研究中经常遇到的是这种情况下对总体参数μ进行推论的问题。

[3]  假设例1σ2未知,已知;

n110 =78S18n2=36 79S29,问其总体参数μ的.95置信间距是多少?

解:求标准误,

 

 

95的置信间距:

n110的样本计算,需查t值表上df101一栏,得 t0522262

                      782.262×267<</SPAN>μ<78 + 2262×267

                                7196<</SPAN>μ<8404

n236的样本计算,需查t值表上df361一栏,得 tα/22042(t值表中没有df=35的表列值,故取近似值,本自由度为35,取df=40    t0522021也可,一般为使推论更稳当些,用较小的自由度取近似值)

          792042×152<</SPAN>μ<79+2042×152

                      759<</SPAN>μ<821

以上两样本的n大小不等,估计的区间长度不同。显然,样本较大的置信估计具有更大优越性:置信区间长度小,样本 更接近μ

上题中,由于n>30t分布渐近正态分布,故亦可用Zα/2代替tα/2作近似计算,这样可免去查表的麻烦。结果为76<</SPAN>μ<82,与用t052(35)计算的结果相差甚微。

总体方差未知时,查t值表所求总体参数的置信区间的解释,与正态分布的解释相同:计算结果总体参数μ95%的可能性落在759821之间,意味着作总体参数在759821之间的结论时,估计正确的概率为95,错误的概率为.05

 

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有