如果我们重复观察n次,某事物出现了m次,比值μn=m/n,称为该事物出现的频率。频率可以作为该事物出现可能性大小的一种度量,也就是说:频率越大,该事物出现的可能性越大;频率越小,该事物出现的可能性越小。我们发现靠重复观察获得的频率值,并不是一成不变的,即使重复观察的次数n不变,每作n次观察,得到的频率也是不一样的。但加大观察次数n,每次观察得到的频率相差值会不大,甚至越来越接近,会稳定于某一个常数值。这种现象屡见不鲜,比比皆是,这种现象说明了什么?能说频率的极限是这个常数值吗?
让我们看一个传统的、具体的例子。比如掷一枚硬币,硬币材质是均匀的,两面有不同的图案,一面是牡丹花,另一面是币值。每掷一次硬币可能出现花面,也可能出现字面。如果掷100次硬币,花面出现了46次,我们说花面出现的频率是46%。后来又掷硬币100次,花面出现了51次,这时得到花面出现的频率却是51%。这就是我们前面所说的;“频率可作为事物出现可能性的度量,频率随不同观察有变化”。
如果加大掷硬币的次数,看看频率有何变化?历史上不少人已做过这样的实验,有这样的实验记录:蒲丰掷硬币4040次,花面出现2048次,算出频率为0.5069;K·皮尔逊掷硬币12000次,花面出现6019次,算出频率为0.5016;又一次K·皮尔逊掷硬币24000次,花面出现12012次,算出频率为0.5005.
好了,你也可以作此实验,只要不厌其烦,你可以掷硬币一百万次、一千万次,……,记录下花面出现的次数,可算出每次花面出现的频率。你可以发现花面出现的频率,越来越接近1/2 .在《概率论》中,就把1/2称为硬币花面出现的概率。
这种给出一事件出现概率的方法,称为事件的概率统计定义。
曾经有位数学家冯·米赛斯说,频率μn=m/n的极限就是概率p,并记成
limμn=p.
这种说法及记法实际上是错误的,这是因为我们所说的数列{an}的极限,其中数列的各项an都是确定的数,an随着n的无限增大越来越靠近一个常数A,这个常数A就是该数列的极限,这时才可用极限符号“lim”表达,即
liman=A.
而频率μn=m/n,它不是确定的数,其中m可取0,1,2,……,n中的任一个值,而且取每个值的可能性并不一样。比如当掷硬币100次时,m取48,49,50,51,52等的可能性远远大于m取0,1,2,及98,99,100 的可能性。这种不确定的数,称为随机数(或随机变量),随机数列{μn}随n无限增大的变化趋势,怎能用确定数数列的极限来描述呢?因为不排除μn=m/n在变化的取值中,m取0,1,……及……,99,100等极端值,而使频率μn远远偏离概率值p.显然,冯·米赛斯的做法犯了错误。
在《概率论 》的发展中,后来能精确描述频率与概率关系的是“大数定律”和依概率收敛的概念,由数学家贝努利解决,他给出的贝努利定律以严格的数学形式,表达了频率的稳定性,这就是当n无限增大时,事件发生的频率与概率有较大偏差的可能性很小, 这涉及专门的数学知识,就不能多叙述了。
加载中,请稍候......