加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

黄文璋:铜板出现正面机率之检定 ——程阳祝贺高雄黄文璋教授荣退

(2015-01-18 13:52:46)
标签:

程阳彩票

黃文璋教授榮退

惆宄霈f正面

機率之檢定

分类: 彩理探考

黃文璋:銅板出現正面機率之檢定

 ——程陽祝賀黃文璋教授榮退

 

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

 

 

多談無益,底下我們便來實作假設檢定。機率與統計裡,不少主題的討論,常由銅板開始。所以首先會想到的,應是檢定銅板出現正面的機率。雖說處理的僅是銅板,但大家知道,其原理可應用至很多能重複觀測的情況,只要能將出現的結果分成兩類。對於銅板,若欲檢定其出現正面的機率p,該如何進行呢?當然是先投擲再說。如同以往,各次投擲間假設相互獨立,則投擲n次後,所得之正面數X,便有二項分佈B(n,p)。

 

先將虛無假設及對立假設,取為

 

H0:p=0.5,Ha:p=0.6,

 

即H0與Ha皆為簡單假設。這可能源自於由觀測,懷疑銅板並非公正,且出現正面的頻率較高,似為0.6。為了簡便,考先慮較小的n,且就取n=10,如此X有B(10,p)分佈。直觀上,若出現的正面數較多,會拒絕H0。所以拒絕域取為{X≥k}的型式,其中k可能為0,1,…,11。怎會有11?此表不會拒絕H0,即一定接受H0。至於k的選取,則依事先給定的顯著水準(即第一型錯誤機率之上限)α而定。對p=0.5,0.6,及0.7,我們分別給出B(10,p)分佈之累積機率P(X£k),k=0,1,…,10,於表2。

 

表2 B(10,p)分佈之累積機率P(X£k)

 

p\k 0 1 2 3 4 5 6 7 8 9 10
0.5 0.001 0.011 0.055 0.172 0.377 0.623 0.828 0.945 0.989 0.999 1
0.6 0 0.002 0.012 0.055 0.166 0.367 0.618 0.833 0.954 0.994 1
0.7 0 0 0.002 0.011 0.047 0.15 0.35 0.617 0.851 0.972 1
 

 

在分別給定α=0.1,0.05,及0.01之下,我們來決定檢定。所謂決定檢定,即給出拒絕域。

 

(1)首先取α為0.01。由表2,若取拒絕域={X≥10}={X=10},則第一型錯誤之機率為

 

P(X≥10|p=0.5)=1-P(X£9|p=0.5)»1-0.999=0.001,

 

此值遠比事先選定的α=0.01小很多(指位階,一為10的-3次方,一為10的-2次方)。是拒絕域取的太小嗎?只是若取的稍大些,即改取拒絕域={X≥9}={X=9,10},則第一型錯誤之機率成為

 

P(X≥9|p=0.5)=1-P(X£8|p=0.5)»1-0.989=0.011,

 

超過所給的α=0.01。所以,就取拒絕域={X≥10}。拒絕域確定後,來求第二型錯誤之機率。由表2,得

 

β=P(X£9|p=0.6)»0.994,

 

這機率可說相當大。也就是當實際上p=0.6,卻會很容易拒絕Ha,而仍接受H0:p=0.5。雖第一型錯誤之機率,被壓到才0.001,但第二型錯誤之機率,卻很接近1,何以會如此?這樣合理嗎?原因是p=0.5與0.6差異並不太大,導致當p=0.6時,X的值會落在接受域{X£9}的機率(0.994),與p=0.5時,X的值會落在接受域的機率(0.999),都很大且相差有限。換句話說,不論p=0.5或0.6,都不容易拒絕H0。於是當p=0.6時,犯錯(接受H0:p=0.5)也就很難避免(機率0.994)了。

 

(2)其次取α為0.05。由表2,該取拒絕域={X≥9}={X=9,10}。則第一型錯誤之機率為

 

P(X≥9|p=0.5)=1-P(X£8|p=0.5)»1-0.989=0.011,

 

比0.05小很多。但再度拒絕域不能再大了,因若改取稍大的拒絕域={X≥8}={X=8,9,10},則第一型錯誤之機率成為

 

P(X≥8|p=0.5)=1-P(X£7|p=0.5)»1-0.945=0.055,

 

超過所給的限制α=0.05。所以,就取拒絕域={X≥9},比α=0.01時大。我們知道,α愈小,表H0愈被保護,因此拒絕域將愈小,即愈不容易拒絕H0。又此時第二型錯誤之機率為何?由表2,得

 

β=P(X£8|p=0.6)»0.954。

 

(3)再看α=0.1。由表2,該取拒絕域={X≥8} ={X=8,9,10}。則第一型錯誤之機率為

 

P(X≥8|p=0.5)=1-P(X£7|p=0.5)»1-0.945=0.055。

 

至於第二型錯誤之機率,由表2,得

 

β=P(X£7|p=0.6)»0.833。

 

上述3種情況,之所以第二型錯誤的機率β都相當大,關鍵皆在於對立假設中的p=0.6,與虛無假設中的p=0.5,二值不算差太大。現改變Ha:p=0.7。在α分別為0.01,0.05,及0.1之下,讀者不妨自行檢定

 

H0:p=0.5,Ha:p=0.7,

 

以為比較。此時β分別約為0.972,0.851,0.617,是變小一些。

 

附帶一提,由表2,亦可求出α在不同的範圍裡,各自的拒絕域。當0<α<0.001,拒絕域為空集合,即都接受H0;在0.001£α<0.011,拒絕域={X≥10};在0.011£α<0.055,拒絕域={X≥9};在0.055£α<0.172,拒絕域={X≥8};在0.172£α<0.377,拒絕域={X≥7};餘此類推。另外,如果觀測到X=9,則先由表2,求出p-值»0.011,然後再視給定的α值,而做決策。例如,若α=0.01,則接受H0;若α=0.05,則拒絕H0;若α=0.1,則亦拒絕H0。

 

由對稱性,若虛無假設及對立假設,分別取為H0:p=0.5,Ha:p=0.4,則當正面數較少,會拒絕H0。故可取拒絕域為{X£k}的型式,這也符合直觀。對給定不同的α值,拒絕域及β值,皆可對應求出,在此略去。但讀者能否看出,本檢定與前述檢定H0:p=0.5,Ha:p=0.6,二者拒絕域及β值,其間之關係?

 

以上都是關於簡單假設,我們再來看一對立假設是雙邊假設(亦為複合假設)的情況。考慮H0:p=0.5,Ha:p≠0.5,且仍取n=10。也就是只懷疑銅板並非公正,但對p值為何,並無特別的看法。再度,經由直觀,當正面數較多或較少,皆該拒絕H0。通常取對稱的拒絕域{X≥5+c,或X£5-c},其中c為一正整數。可證明在相同的α下,對稱的拒絕域,會使第二型錯誤之機率較小。這只要由二項分佈的機率密度函數之漸增及漸減性質,便可得知,不過此處不多討論。對α分別為0.01,0.05,及0.1之下,我們分別給出拒絕域及第一型錯誤之機率,過程則略去:

 

{X≥10,或X£0}={X=0,10},0.002;

 

{X≥9,或X£1}={X=0,1,9,10},0.022;

 

{X≥9,或X£1}={X=0,1,9,10},0.022。

 

由於在此Ha為複合假設,故第二型錯誤之機率並非定值,而為一函數β(u),其中u為區間[0,1]中之一數,但u≠0.5。例如,在α=0.05之下,由表2,β(0.6)»0.952,β(0.7)»0.851。我們注意到β(0.7)<β(0.6),這是合理的。甚至,當u屬於[0,0.5),函數β(u)為漸增;當u屬於(0.5,1],函數β(u)為漸減。其原因並不難想通,就留給讀者自行思索。

 

檢定銅板出現正面的機率p,不見得要經由二項分佈。如果p較小,則當投擲數不多時,正面並不太會出現。此時不妨考慮利用幾何分佈(geometric distribution)來檢定p。稍後我們再回到以二項分佈來檢定,以為比較。

 

持續投擲銅板,直至出現第一個正面才停止,令Y表總共之投擲數。則Y便稱有參數p之幾何分佈,以Ge(p)表之,且有

 

P(Y=k)=(1-p)k-1p,

 

其中k=1,2,…。此機率的由來,是因Y=k,表前k-1次皆出現反面(每次機率為1-p),最後1次出現正面(機率為p)。至於分佈名稱之由來,是因其機率值為一幾何(等比)級數。二項分佈是投擲數固定,出現正面數為隨機。至於幾何分佈,則是出現正面數固定(1次),而投擲數為隨機。幾何級數的和,求法相當簡易,大家中學時便學過了。利用其和的公式,即得Y之累積機率

 

(1) P(Y£k)=1-(1-p)k,k=1,2,…。

 

由此又得

 

(2) P(Y≥k)=(1-p)k-1,k=1,2,…。

 

現考慮

 

H0:p=0.01,Ha:p=0.02。

 

直觀上,p愈大愈快出現正面,由是Y會愈小。因0.02>0.01,故拒絕域該取為{Y£k}之型式,其中k由給定的α來決定。對0<α<1,由

 

P(Y£k)=1-(1-p)k£α,

 

解出

 

k£log(1-α)/log(1-p)。

 

而k須為整數,故取

 

(3) k=[log(1-α)/log(1-p)],

 

其中[x]表不超過x之最大整數。符號[×]最早出現在高斯的巨著“算術研究”(Disquisitiones Arithmeticae)一書中,故稱高斯符號(Gaussian symbol)。現將p以0.01,α則分別以0.01,0.05,及0.1代入(3)式,得到k分別為

 

[log(0.99)/log(0.99)]=1,

 

[log(0.95)/log(0.99)]=5,

 

[log(0.9)/log(0.99)]=10。

 

即拒絕域分別為{Y£1},{Y£5}及{Y£10}。有了拒絕域,第一型錯誤的機率,利用(1)式,分別為

 

P(Y£1|p=0.01)=1-0.991=0.01,

 

P(Y£5|p=0.01)=1-0.995»0.0049,

 

 

P(Y£10|p=0.01)=1-0.9910»0.0956。

 

至於第二型錯誤的機率,利用(2)式,分別為

 

β=P(Y≥2|p=0.02)=0.981=0.98,

 

β=P(Y≥6|p=0.02)=0.985»0.904,

 

 

β=P(Y≥11|p=0.02)=0.9810»0.817。

 

為了比較,底下我們再以B(10,p)分佈,重新檢定H0:p=0.01,Ha:p=0.02。對X有B(10,0.01)分佈,P(X£0),P(X£1),及P(X£2),分別約為0.904,0.996,及1。又對X有B(10,0.02)分佈,P(X£0),P(X£1),及P(X£2),分別約為0.817,0.984,及0.999。由此即得,在α分別為0.01,0.05,及0.1下,拒絕域分別為{X≥2},{X≥2},及{X≥1},且第一型錯誤的機率,分別約為0.004,0.004,及0.096。至於第二型錯誤的機率,則分別約為0.984,0.984,及0.817。可看出,由於在H0裡,p的可能值0.01較小,因此若以二項分佈來檢定,在不同的α下,拒絕域容易相同。這是此時會考慮藉助幾何分佈來檢定的主因。讀者也不妨想想,當可能的p較大時,有沒有必要以幾何分佈來檢定?

 

最後來看X有B(n,p)分佈,但n較大的情況。假設要檢定

 

H0:p=1/2,Ha:p≠1/2。

 

再度取拒絕域為{|X-n/2|≥c}={X≥n/2+c,或X£n/2-c},其中c由n及α決定。取n=100,因n較大時,二項分佈的機率值不好算,故利用中央極限定理,以常態分佈來近似。先看α=0.01,則c約為12.88,取整數c=13。如此拒絕域={X≥63,或X£37},且第一型錯誤之機率約為0.0094。對離散型分佈,往往無法取到剛好能達到所給α值之拒絕域。次看α=0.05。得c約為9.8,取c=10。如此拒絕域={X≥60,或X£40}。所給的α增大,拒絕域合理地增大些,又此時第一型錯誤之機率約為0.0456。再看α=0.1。得c約為8.225,取c=9。如此拒絕域={X≥59,或X£41},拒絕域又增大些了,而第一型錯誤之機率則約為0.0718。

 

我們注意到,當α=0.01,如果投擲銅板100次,得到62個正面,雖比在H0之下 (銅板為公正)的期望值50多了12,即超過24%,感覺上相當偏差,但因62並未落在拒絕域,遂仍得接受此銅板為公正。沒辦法,那是因所給α太小的緣故。解決之道是加大n。假設取n=10,000,則在H0之下,X的期望值=5,000,標準差=50。則當α=0.01時,c約為128.8,故取c=129,此時拒絕域={X≥5,129,或X£4,871}。投擲數成為100倍後,正面數X,只要比期望值5,000偏離逾129/5,000=2.58%,就得拒絕H0了。2.58%自然比24%小很多了。樣本大尚有另一優點,即在同樣的α下,n愈大,除了會使拒絕域相對n而言愈窄,也會降低第二型錯誤的機率。直觀上是對的,因樣本愈大便愈精準。不過這方面的討論,比較複雜些,在此略過。另外,在以上的幾個例子裡,我們以直觀所得到的拒絕域,事實上都是最佳拒絕域。也就是在同一α下,會使第二型錯誤的機率最小。這在統計學裡並非偶然,很多時候,人們憑直觀得到的結果,不但壞不到那裡去,常就是最好的。

 

黃文璋:銅板出現正面機率之檢定——程陽祝賀黃文璋教授榮退

程阳:渺茫奇迹与彩票奇奖的数学解释

程阳:关于彩票的需求价格弹性的对话

程阳:彩票号码的马尔科夫预测之误区

程阳:Critical Values for the Mann-Whitney U-Test

程阳:斯坦福大学期刊——最大熵与彩票 Maximum Entropy and the Lottery

程阳:色彩,如何影响彩票销量?

程阳:市场数据分析的多维标度法(multidimensional scaling,MDS)

程阳:来自网络的彩票日语词汇

程阳: “德·梅尔问题”的求证

程阳: 彩票“没中”为什么叫“扛龟”

程阳:《世界彩票年鉴》彩票术语规范

程阳:全球博彩业财务统计释义

程阳:财政年度 Fiscal Year

程阳:意大利画家卡拉瓦乔作品《老千》欣赏 Caravaggio The Cardsharps

 

 

 黃文璋教授榮退

http://blog.sina.com.cn/s/blog_507de1780102vj8u.html

 

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

黄文璋:铜板出现正面机率之检定 <wbr>——程阳祝贺高雄黄文璋教授荣退

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有