认识机率


1. 前言

1987年,是印度传奇数学家拉曼努扬(Srinivasa Ramanujan,1887-1920) 的百年诞辰。 为了纪念他,有一系列的活动。 当代著名统计学者,出生于印度的劳氏(C. Radhakrishna Rao,1920- ),也应邀做了三场演讲。 之后,印度统计学研究所(Indian Statistical Institute) 基于劳氏的演讲稿,于1989年,为他出版了统计与真理一书。 此书于1997年发行第二版。

在第一版的序文中,劳氏提到: 学生时代,我主修数学——一种从给定前提下演绎结果的逻辑(the logic of deducing consequences from giving premises)。 后来我念统计学——一种从经验中学习的理性方法,及从给定的结果验证前提的逻辑(a rational approach to learning from experience and the logic of identifying the premises given the consequences)。 我已认识到数学及统计,在人类为提升自然知识,及有效管理日常事务,所做的一切努力中,占有重要性。 我相信:

在最终的分析中,所有知识皆为历史。
在抽象的意义下,所有科学皆为数学。
在理性的世界里,所有判断皆为统计。

这一段话,大致说明数学及统计的重要性,及其各自的内涵。

长期以来,高中数学均涵盖机率的题材,其中古典机率(即以“相同的可能性”来解释机率) 又占不小比例。 因此机率常与排列组合连在一起。 而排列组合是较 “数学的”。 虽然学生有时会被那些复杂的题目,弄得昏头转向。 但那只是技巧性方面,在认知方面,大抵没太大迷惑。 近年来,鉴于统计学的重要性,高中数学里,逐渐加进统计的题材。 这其中 95学年开始实施的“普通高级中学数课程纲要”中,新增的信赖区间与信心水准,却带给师生不小困扰。 此新加入的统计题材,由于需取样,得到数据,使机率论里“随机性” 的特质显现出来。 而随机性与传统数学中特有的“ 必然性”,乃完全不同的概念。 可参考黄文璋(2005a)一文。 虽有人认为机率与统计,“ 这类数学所需的前置准备不多”,因此提前教没问题。 但随机性的概念,在理解层次上,其实并不是那么容易能掌握。

翻开统计史,信赖区间,是另一著名统计学者,出生于波兰,1938年才移民至美国的奈曼(Jerzy Neyman,1894-1981。 他是我的师祖,即我指导教授的指导教授),于1934年演讲中首度提出。 他的演讲结束后,大会主席包雷(Arthur Lyon Bowley,1869-1957) 于致词中提到,“我不很确定此信心不是一信心戏法” (I am not all sure that the “confidence”is not a “confidence trick”)。 要知奈曼信赖区间的概念刚提出时,大部分的统计学者,包括被视为是现代统计学之创始者,英国的费雪(Sir Ronald Aylmer Fisher,1890-1962,常以 R. A. Fisher称之)均难以接受。 在所谓95%信赖区间中,那95%究竟是指什么? 是机率吗? 如果是,那又是什么的机率? 虽奈曼取巧地以信赖区间,来称呼此一他创造出来的东西,而避用机率一词。 但包雷及其同行,当然一眼便看穿这个手法 (Bowley and others easily saw through this transparent ploy)。 这段过程,可参考 Salsburg (2001) Chapter 12(但该书中的 A. L. Bowley应该是 G. M. Bowley),及 Sawilowsky (2003) 一文。

岁月匆匆,七十多年过去了,今日统计学家,当然已完全弄懂信赖区问的意义。 只是在大学里,不论在机率与统计、 统计学,及数理统计等教科书中,信赖区间通常属于后半部的题材。 也就是大学生在相关的课程中,开始接触信赖区间时,大致上已有相当够的机率统计基础。 如今此题材却获数学家青睐,继95课纲加入后,98课纲(后改为99学年度起逐年实施)仍保留此题材。 但由于缺乏足够的预备知识,高中生吸收不易,乃可预期。

为何此“有点深度”的题材,却能堂而皇之地进入高中数学教材? 猜想主要原因是其重要性。 这只要看到媒体上,常刊载各种调查结果的信赖区间,及信心水准,便可了解。

在有些统计教科书里,信赖区间占一章的份量。 对不同的参数,不同的分布,可有不同的信赖区间; 即使同一参数且同一分布,也可以不同的方法,得到不同的信赖区间。 有时因条件不足,或计算复杂等原因,只好退而求其次,得到近似的信赖区间。 当然这时需要一些条件,及利用一些定理。 信赖区间亦可比较优劣。 要知统计里有各种推论方法,但因处理的是随机现象,少有倚天既出,谁与争锋的方法。 而评比时,也要订出评比准则。 否则就像有个停止不动的钟,及一每日慢1分钟的钟,如何判定何者较准? 前者可是每日皆有完全准确的时刻,后者却是每1,440天(一天有1,440分),才有一完全准确的时刻。 不讲清楚如何评比,将会各说各话。

在98课纲,附录3.3“常态分布,信赖区间与信心水准的解读” 中说:

高中程度的统计推论只做随机变数期望值的估计,它的背后理论是中央极限定理。 要介绍中央极限定理,就需引入常态分布。 此部分仅做通识性的介绍,以活动方式建立学生对于中央极限定理的直观。 对一固定的信心水准,给出信赖区间公式,再让学生以乱数表模拟或实验投掷正面出现机率为 $p$ 的铜板 $n$ 次,代入信赖区间公式,以说明信心水准的意涵; 并以此解读,何以大多数学生所得的信赖区间都会涵盖 $p$? 这段“解读”不但有若干问题,也没能说明白。 如第一句中“它的背后理论是中央极限定理”,便不知从何而生? 此非统计学里的看法。 由于课纲中的解读晦涩不明,那些认真教学,想将学生教懂的高中数学教师,只好钻研其中原理,各自解读。 有些还提出自认能“厘清这些概念”的文章。 只是其解读,往往仍失之精准。

为何信赖区间的概念,常会沦于类似郢书燕说的下场? 追根究底,还是不少学习者,未能正确了解机率的涵意。 这是本文写作的动机。

2. 机率的意义

一股子有6个面,一掷之下,会得到偶数之机率为何? 股子看起来没有异样,就假设每个面出现的机率皆相同,即均为1/6。 而偶数面有2,4,及6等3个。 因此所求之机率为3/6。 这就是所谓古典的机率,基本假设是“相同的可能性”。 先求出观测的现象共有几种可能,再求出其中有几件是我们有兴趣的。 将后者除以前者,即为所要的机率。 虽说是“古典”,这种机率的意义,至今仍处处可见。 采用的范围包含诸如抽签、 玩扑克牌,及玩乐透彩等。 又如某项工作征才,报名的有82人,录取5人。 若没有什么特别的资讯,便只能假设每人被录取的机率皆相同,即皆为5/82。

2009年7月底8月初,世界高尔夫球王老虎伍兹(Tiger Woods),参加在美国密执安州举行的别克公开赛(Buick Open)。 第1轮打完,落后领先者多达8杆,排名并列95。 引发他可能难逃职业生涯,首次连续2场比赛(前一场是英国公开赛(The Open Championship,在英国之外常称为British Open)),提前被淘汰的话题。 不过老虎毕竟不能小觑,打完前3轮后,伍兹跃居首位。 这时大家看法丕变,一致认为这座冠军杯,几乎可说是他的囊中物了。 因过去的纪录显示,伍兹如能带着54洞领先进入决赛圈,战绩是35胜1败。 你要不要猜后来他赢了没有? 运动比赛,往往有过去资料可参考,此时相同的可能性便不宜用了。 36次中成功35次,“ 相对频率”为35/36(约0.972)。 这种以相对频率来解释机率,是常有的作法。 适用能重复观测的现象。 会不会有爆出冷门的时候? 当然有。 只是对一特定事件,用过去多次同样情况下,该事件发生的相对频率,来估计下一次事件发生的机率,乃是在没有更多资讯下,常被认为一属于客观的办法。

某君看上一女孩,惊为天人,觉得这是他今生的新娘。 评估后信心满满,自认追上的机会有8成。 旁人却都不看好,问他8成这一数字,是如何冒出来的? 该君举证历历,一个又一个的迹象,显示那女孩对他很有好感。 这个0.8的机率,就是所谓主观机率。 主观机率当然也可基于过去一些客观的事实。 只是即使面对同样的资料,不同的人,可能有不同的判定,因而给出不同的主观机率(看过他其实没那么喜欢你(He's Just Not That Into You)吗? 片中那个叫Gigi的女孩,便常误解男生所透露的讯息)。 有些现象就是不能重复观测。 如核能电厂的意外,及彗星撞地球等。 以追女孩为例,大约少有女孩,会让你做实验,反复地追,然后数一数其中成功几次,来定下她会被你追上的机率。 对这类无法重复观测的现象,在谈机率时,主观机率就常派上用场。 每天早上出门,我们不是惯于抬头看天,判断一下今天下雨的机率有几成? 只是往往父母认为的机率会大些,该带伞,而小孩所认为的下雨机率会小些。

虽说“主观”,但仍要合理。 例如,考试有及格与不及格。 若认为会及格的机率为0.9,这没问题,人总要有点自信,但若又同时担心有0.8的机率会不及格,那就不行了。 各种可能性发生机率相加要为1。 即使是主观,可以独排众议,仍须自圆其说。 不能说,既然是主观,便可以任意自定各事件之机率。 因此不论是那一种对机率的解释,都自然地,或说必须要满足一些共同的规则。 这点大家应能理解。

上述三种是常见对机率的解释,大抵也就是人们评估事件发生可能性之大小的几种思维。 虽是针对不同的情况,但常能交互着运用。 大家都听过曾参杀人的典故吧! 有个与曾子同名的人杀人,好心者告诉曾母“曾参杀人”。 曾母说“吾子不杀人”,继续织布。 过一会儿,又有人来说“曾参杀人”。 曾母仍继续织她的布,这么好的儿子怎可能杀人? 但当第三人跑来说“曾参杀人”,曾母就害怕了,丢掉织布器具翻墙而逃。 所谓“其母惧,投抒踰墙而走”。 这故事出自战国策秦策二。 因此当拿到一铜板,可主观地认为,政府发行不该会有偏差,两面出现的机率,应皆为1/2(这也可以是基于相同可能性之想法)。 若投掷10次,正面出现8次,可能觉得有些奇怪。 若继续投掷,结果100次中,出现80个正面,这时相对频率的观点,很可能便将显现。 类如曾母,调整看法,不再认为此铜板公正。

当然,你可以不信邪,不论投掷的结果如何,皆认为那只是短暂的情况,意志坚定地认为这是一公正的铜板。 这并没有不行,就像会有母亲,即使再多的人证,只要她没亲眼看到,她就不信儿子会杀人。 要知随机现象,事件只要机率为正,不论机率值多小,便皆可能发生。 毕竟铜板正面出现的机率为何,只有天晓得。 但引进机率与统计,乃为了协助我们做决策可以更精准。 而决策可以与时推移,并非不能更改。 有如气象局对台风会带来多少雨量,须密切掌握新的动向,而随时修正。 要有随机的思维,如前言中劳氏所说的,从给定的结果,验证前提。 因此针对100次投掷,出现80个正面,多数人面对此结果,还是会认为0.8的正面出现机率,较0.5的机率可信。 稍后我们会再来看,10次中的8次,与100次中的80次,相对频率同为0.8,但提供的资讯,是否有异?

虽然已有上述三种对机率的解释,也涵盖了不少实际生活中所遇到的情况,数学家当然不会在此止步。 他们喜欢抽象化,及一般化。 像解方程式,会寻求公式,以表示出某类方程式的解,而非只满足于求出一个个的特例之解。 又如当完全了解实数系统后,便会以公理化的方式,定义实数系统。 即给一集合,没说是数字的集合,对其中的元素定义二运算,并给出10条遵循的公理(axiom,规则)。 你好奇该二运算是否一为加法,一为乘法? 而怎么没有减法与除法? 名可名,非常名,数学家不认为你提出的是重要的问题。 但用心体会后,你终于发现原来二运算,其一等同于加法,其二等同于乘法。 也看出此集合中,有一元素根本就是0,而有一元素根本就是1。 数学家对你的洞察力,仍不以为意,但同意你可以这样想。

什么叫以公理化的方式,来引进机率? 先要有一个集合,称做样本空间,当做某一观测之所有可能结果的集合。 可以真的有这一观测,或只是虚拟的。 样本空间的某些子集合,是我们有兴趣的,这些就是一个个的事件。 所有事件也构成一集合。 最后定出一机率函数,即对每一事件,给一介于0,1间的值,为该事件之机率。 样本空间、 事件的集合,及机率函数,三者便构成机率空间 (probability space)。 这其中对样本空间没有太大要求,但不可以是空集合。 而事件的集合,要满足若干条件。 简单讲,就是你有兴趣的事件不能太少。 譬如说,不能只对某事件 $A$ 发生有兴趣,却对$A$不发生没兴趣。 因此事件的集合要够大,至少该有的都得纳入。 这有点像婚宴前拟宾客名单。 可以请很少人,如只有双方家长。 而一旦多列了某人,与他同样亲近的人便也要一并请。 所以每多列1人,将不只是增加1人而已,而会随之增加几位。 又机率函数,既然以机率之名,当然要符合过去大家对机率的认知,满足一些基本的条件。 机率空间的定义,可参考黄文璋 (2010b)。

在机率空间的架构下,不论采用何种方式解释机率的人,都可各自表述,找到他所以为的机率意义。 但因抽象化后,不再局限于铜板、 股子,及扑克牌等,便能讨论较一般的问题,有够多的理论可挖掘。

与数学的其他领域相比,机率论的发展是较晚的。 但公理化后,机率论便快速地有了深而远的发展,并成为数学中一重要的领域。 这都要归功于二十世纪那位重要的机率学家,俄国的科莫果洛夫 (Andrey Nikolaevich Kolmogorov,1903-1987),于他 1933 年出版,那本不到100页的小书机率论的基础(Foundations of the Theory of Probability)中所奠定。 在此书中,他说:

机率论作为数学学科,可以而且应该从公理开始发展,就如同几何、 代数一样(The theory of probability as mathematical discipline can and should be developed from axioms in exactly the same way as Geometry and Algebra)。

3. 何处是机率天地

有法国牛顿之称的拉普拉斯(Pierre-Simon,Marquis de Laplace,1749-1827) 曾说:

这门源自考虑赌博中的机运之科学,必将成为人类知识中最重要的一部分,生活中最重要的问题中的大部分,都将只是机率的问题(This science,which originated in the consideration of games of chance,should have become the most important object of human knowledge. The most important questions of life are,for the most part,really only problems of probability)。

机率是针对随机现象。 但世上并非每件事都是随机的,我们说过还有必然性。 假设投掷一两面皆是人头的铜板,并观察会得到那一面。 你晓得这是一必然现象,但仍可说会出现人头的机率为1,而其他情况出现的机率为0。 也就是视此为一“退化的”随机现象。

某些物理学家,说不定认为对投掷铜板,由给定投掷的速度、 角度、 地面的弹性、 铜板的形状及重量等条件,可算出铜板落地后,会那一面朝上,因此这不是随机。 至于乐透彩的开奖,只要起始条件都能测出,则会开出那一号球,也能算出,因此这也不是随机。 但你大约也知道所谓蝴蝶效应(butterfly effect)。 量测极可能有误差,而有时一些微小的改变,影响却可能很大。 因此我们宁可相信这些都是随机现象。

某些神学家,可能认为一切其实都是按照神的旨意在进行,只是我们不知而已。 说不定真是如此。 你看过杰逊王子战群妖(Jason and the Argonauts)吗? 这是一部基于希腊神话的电影,内容与十二星座中的牡羊座有关,1963出品。 我虽是幼时看的,至今仍印象深刻。 片中杰逊王子遭遇的各种突如其来的灾难,以及一次又一次英勇的逢凶化吉,不过是天后赫拉(Hera),与天神宙斯(Zeus) 在较劲,分别作梗及协助。 但若无从了解神的旨意,对于未来,也只好视为随机。

随着科技进步,人们逐渐弄明白很多现象的来龙去脉。 例如,我们知道女性一旦怀孕,婴儿性别便已确定。 但对一大腹便便的妇女,好事者由于不知,仍可猜测其生男生女之机率。 考试前夕,学生们虽认真准备,但还是绞尽脑汁猜题,各有其认为考出机率很大的题目。 老师获知后,觉得好笑。 课堂中已一再暗示明示,那些题会考,几乎都该能确定了,何需再猜? 实则试题早已印妥,而学生不知考题,且未体会老师的暗示及明示,所以仍可以大猜一通。 另外,诸如门外有人敲门,你好奇是男是女? 老师要你猜拿在背后的水果,是橘子或苹果? 同学盖住落地的铜板,要你猜正面或反面朝上?这类明明已确定的事,本身其实并不随机,只是对你而言,却有如惠子在秋水篇所说的“ 子非鱼”,当然可猜鱼快乐的机率。

但对已命好题目的老师,去判断那一题会考出的机率,就没什么意义了。 因对他而言,每一题会考出的机率,只有1或0,不会是其他值。 同样地,对看到背后水果的人,水果会是橘子或苹果的机率,将只能说1或0。 随机与随意不同。 我们说过了,机率中那套逻辑,是有够大的弹性,让人能挥洒,只是仍要合理,否则就是抬杠了。 若你明明知道那是苹果,硬要说它是橘子的机率为0.5; 或明明已从医生处掌握一切讯息的待产妈妈,还说生下来,是男是女的机率皆为0.5,那就不是在谈机率了。

4. 解释机率

在第2节我们以机率空间的方式引进机率。 由于样本空间可以是虚拟的,此时事件也就是虚拟的。 但假设真的有一项观测,如投掷一个4面体,4面分别标示点数1,2,3,4,并观测所得点数。 则样本空间为1,2,3,4之集合。 事件的集合可以取那一个最大的,也就是包含样本空间之所有子集所构成的集合。 你如果学过排列组合,便知此最大的事件集合中,共有16(2的4次方)个元素。 至于机率函数,假设点数1,2,3,4出现的机率,分别为0.1、 0.2、 0.3,及0.4,相加为1。 至于任一事件的机率,就看该事件包含1,2,3,4中那几个数,再把对应的机率相加便是。 如一事件中恰包含2,4,则该事件的机率为0.2+0.4=0.6。 馀此类推。 这就建立了一机率 空间。 对同一样本空间,可定义出很多不同的机率空间。

就算你已接受了机率空间的概念,反正数学家就是常给一些自得其乐的定义,仍可能会好奇,所谓点数1出现的机率0.1,究竟是什么意思? 是每投10次,点数1恰出现1次吗? 非也! 有个修过机率论的数学系毕业生,好心地对你解释如下:

假设投掷 $n$ 次,点数 1 出现 $a$ 次,则相对频率 $a/n$ 与 0.1 之差的绝对值,会大于一给定的正数(不管它多小)之机率,将随着 $n$ 的趋近至无限大,而趋近至0。

务实的你,很可能不觉得这样的解释很实际。 先提出疑问“ 什么是趋近至无限大?”就是一直投掷,不可停止,日出日落,春去秋来,继续投掷,即使夸父追日成功了,无限大也仍未达到,还得投掷。 那位数学系毕业生,一听到你问起无限大,如鱼得水,这是他在数学系四年寒窗,学到的几招独门绝活之一。 你不得不停止无限大这个话题,因连夸父追日,你也觉得岂有成功时? 如何能接受解释机率,还得涉及无限大? 但还一点你不吐不快的是“ 我就是不了解机率值的意义,怎么却用机率的概念来解释给我听?”

想解释机率值的意义,将会在机率及无限大,一层又一层的打转。 这有如想去定义什么叫做点,结果将如同陷在线团中,学步维艰。 最后只好说,点是无定义名词。 但无论如何,你应可理解,对前述4面体,仅投掷1次,是无法显示点数1出现机率0.1,那个0.1的意思。 机率并非只看“少数几次”的结果。 机率是在大样本 ($n$ 很大) 下,威力才显现。 机率值的意义,既然不能以一套可接受的逻辑来说明。 那么退而求其次,可否让人略微了解机率值的意思? 或者说(除非是虚拟,只是在求一些机率值),你拿一4面体,且宣称点数1出现的机率为 0.1,怎么样才知道你讲的是真的,而非信口开河,或者说记错。

之前那位数学系毕业生的解释,这时便能派上用场。 此即大数法则(law of large numbers)之一简单的版本。 数学上的意思为,事件出现的相对频率,会“ 机率收敛”至事件发生的机率。 要知随机世界中,仍有些法则要遵循,大数法则是其中很重要的一个。 当然我们已指出了,实际上并无法观测事件无限多次。 那是否可说,事件出现的相对频率,当观测数够大,须接近事件发生的机率? 也非如此。 事件只要机率为正,便都可能发生。 所以,不论观测数再大,都不能排除很偏颇(如观测 1,000,000 次,点数1出现的次数为0,或 1,000,000 次)的事件发生。 但是,这时统计学家跳出来了,可以做一检定,检定点数1出现的机率是否真为0.1,这是属于统计学里假设检定(testing hypothesis)的范畴。 简单讲,是以在某一假设下,会观测到这样的结果,是否算不寻常? 所谓不寻常,是指发生的机率很小,小于某一预设的值。 若属于不寻常,则当初的假设就不宜接受。 附带一提,当假设一铜板为公正,则投掷100次,出现至少80次正面,较投掷10次,出现至少8次正面,前者是更不寻常的,因它发生的机率,远比后者小。 所以,在同样获得八成以上的正面数下,投掷数愈大,将会使我们更相信此铜板非公正,而接受它出现正面的机率,至少是0.8。 这说明在统计里,样本数愈大,将使我们的推论愈精准。 假设检定进一步的讨论,可参考黄文璋(2005b)一文。

在随机世界,究竟何者为真,常属未知。 我们往往无法“证明” 那件事是真实的。 不过是一个个的假设,端看你接受那一假设。 4面体点数1出现的机率,是否真为0.1,即使投掷再多次,都无法证明其真伪。 只能说数据显示“可以接受”,或“ 无法接受”机率为0.1。 这里面有一套机制,以决定接受或不接受。

另外,对一4面体,也可估计点数1出现的机率,有一些不同的估计法,可以得到不同的估计量。 在数学中,使用不同的方法,须导致相同的结果。 所谓殊途同归。 但统计里,除非做些限制,否则常无定于一尊的方法。 对不可测的未来,我们常要做估计,统计在这方面,能扮演很好的角色。 可参考黄文璋(2007)一文。 诸如铜板出现正面的机率,及病人的存活率等,皆能估计。 但有时觉得以一个值估计,虽然明确,但估计值很难恰好等于真实值,一翻两瞪眼,常估计不准。 下节信赖区间的概念,因而产生。

5. 信赖区间

我们常对某一未知的量做估计。 未知的量可以是某事件发生的机率,某分布的参数(如期望值及变异数等),或某物件之寿命等。 这些未知的量,可通称为参数。 有时会以一区间来估计参数,并给出此区间会涵盖该参数之机率。 这就是所谓区间估计,所得的区间,称为信赖区间。 而区间涵盖参数之机率,则称为此区间之信心水准(confidence level)。 与机率一样,信心水准是一介于0,1间的值,常事先给定,且以百分比表示。 90%、 95%,及99%等,都是常取的值。

数据(data) 是统计学家做决策之主要依据。 若缺乏数据,他们往往将一筹莫展。 来看一简单且常见的情况。 假设欲估计一铜板出现正面之机率 $p$。 很自然地,便投掷若干次,譬如说 $n$ 次,并观测 $n$ 次的结果。 这个过程便称为取样。 在本情况中,各次投掷的结果并不重要。 总共得的正面数,以 $a$ 表之。 知道 $a$,就已掌握全部资讯 ($a$ 称为充分统计量(sufficient statistic))。 给定信心水准,并利用 $n$ 及 $a$,可得一信赖区间,但作法并不唯一。 亦即对于 $p$,有不同的信赖区间公式。 但课纲的写法,好像信赖区间的公式唯一。 此处由于其中涉及二项分布,计算复杂些,如果 $n$ 够大 ($n$ 太小则不行),我们常可藉助常态分布来近似。 这要用到机率论里另一重要的法则——中央极限定理(Central limit theorem)。 必须一提,只有以常态分布来近似时,才需用到中央极限定理,并非求信赖区间皆要用到此定理。

对估计铜板出现正面之机率$p$,取样前,信赖区间为一随机区间,若信心水准设定为95%,则有(或精准地说“约有”,如果该信赖区间只是近似的)0.95的机率,信赖区间会包含 $p$。 取样后,得到一固定区间。 则 $p$ 会属于该区间的机率,将不是1便是0,而不再是 $p$ 了。 为何如此? 很多人对此常感困惑。

我们先以下例来说明。 假设某百货公司周年庆,顾客购物达一定金额,便能自 1 至 10 号中抽 1 彩球。 若抽中 5 号,今天在该公司的花费,可获 30% 抵用券。 在抽球之前,你知道有 0.1 的机率能获抵用券,机会不算小。 一旦抽出,一看是 3 号,获抵用券的机率当然便是 0 了。

这类例子很多。 打击手挥棒前,可以说打出安打之机率为 0.341,打完不是安打就非安打,0.341 已派不上用场了。 再给一例。 假设某银行发行的乐透彩,每期自 1 至 42 号中,开出6码为头奖号码。 你签了一注 6 码,开奖前,你知道很容易“至少中1码”,因机率约为 0.629 (见附注1)。 等开奖后,你的彩券会至少中 1 码之机率,将是1(若至少中1码),或是0(若1码皆未中)。

再看如课纲中所说,也可以乱数表模拟出现正面(课纲中少了“ 正面”二字,意思便不通)机率为 $p$ 的铜板 $n$ 次,以求得信赖区间。 你看,$p$ 根本是事先设定,模拟所得之一固定区间,$p$ 有没有落在其间,一看便知,如何能说该区间涵盖 $p$ 之机率为0.95? 就算你不是模拟,而是实际拿一铜板投掷,则 $p$ 只是未知,却为某一定值(说不定发行铜板的单位知道),投掷后所得之固定信赖区间,已无随机性了,它只会涵盖 $p$,或不会涵盖 $p$。 可以这样想,对同一铜板,每人所得之 95% 信赖区间有异,如何能个个皆宣称,其区间涵盖 $p$ 之机率为 0.95?

那95%有何用? 0.95是一机率值,而机率值从来就不是只看一次的实验结果。 大约可以这么说,如果反复实验,而得到很多信赖区间,则其中会包含$p$的信赖区间数,约占全部区间数的95%。 所以,0.95的意义,乃如同上一节我们对机率的解释。 但要留意的是,对同一个 $p$,如果全班 40 人,所得到的 40 个 95% 信赖区间,其中包含 $p$ 的个数未超过 85% (即未超过34个),也不要太惊讶。 此机率约为 0.01388 (附注2),是不太大,但只要班级数够多,便不难发生。 98课纲说“大多数学生所得的信赖区间都会涵盖 $p$”,实在缺乏随机的概念。 有关信赖区间更多的讨论,可参考黄文璋 (2006)一文。

6.情境解读

机率既然与我们的生活习习相关,因此若能善用机率,将有助于在随机世界中,更精准的做决策。 只是却往往机率应用不易,得到的机率值,常被认为是错的。 而且还众说纷纭,各提出不同的机率值。 个中原因何在? 一主要原因,即情境解读有误。

过去大家在数学课程中,会遇到所谓应用题。 题目看懂,写出数学式子后,就是解数学了。 这时便可抛开原先那段冗长的叙述。 但在机率里,有些看似简单的情境,因解读不同,会导致南辕北辙的结论。 底下给几个例子来看。

在电影决胜21点(英文片名就是21)中,那位数学教授于课堂上提出一个问题。 有3扇门,其中1扇门后有汽车,另两扇门后为山羊。 你选择第1扇门后,主持人打开第2扇门,见到山羊。 问你这时该不该换选第3扇门? 有位学生答:

Yes,because my chance of getting the car will increase from 33.33% to 66.67% by switching from door 1 to door 3.

教授则说“Very good!”,认同其看法,也就是该换。 有些人对此提出质疑。

比较正确的讲法应该是,若主持人事先知道汽车在那扇门后,则他会打开1扇门后是山羊的门(这是较合理的作法,否则游戏便无法进行了),这时若换选第3扇门,则如电影中那位学生所述,得到汽车的机率,将由 1/3 增加为 2/3。 但若主持人事先不知汽车在那 1 扇门后 (这当然是少见的情况),只是随机地自第 2 及第 3 扇门中,挑一扇打开,且刚好门后是山羊,则便不用换,因换或不换,得到汽车之机率,皆为1/2。 其中推导,可参考黄文璋 (2010a)一文之例6。

但是读者不知是否注意到,在主持人事先知道汽车在那一扇门后的情况中,我们其实还隐含做一假设。 即若第2及第3扇门后皆是山羊,则主持人乃随机地(即各以1/2的机率)打开第2或第3扇门。 事实上,可以有更一般的假设。 当第2及第3扇门后皆是山羊,假设主持人分别以 $q$ 及 $1-q$ 的机率,打开第2或第3扇门,其中 $0\le q\le 1$。 则换选第3扇门,得到汽车的机率成为 $1/(1+q)$(见附注2)。 原来此机率会受主持人是如何打开第2扇门的影响! 很多人可能未想到这点。 由于 $1/(1+q)\ge 1/2$,所以换,仍是较好的选择。

再看一例。 有一对夫妻刚搬进某社区,大家只知他们有两个小孩,并不知性别。 某日社区一管理员,见到此家之妈妈,带着家中一小孩在玩耍。 若该小孩是女孩,求此家两小孩皆为女孩之机率。 很多人以为此问题不难,认为所求机率就是1/3。 其实此问题比我们想象的复杂很多。 关键在如何将“见到此家之妈妈,带着家中一女孩”,转化为适当机率空间中的事件。 也就是要讲清楚,究竟如何带小孩出门? 要注意的是,前述事件并不等同于“此家至少有一女孩”! 本问题之详细讨论,可参考黄文璋(2010a)一文之例8。

最后看另一常出现于机率论教科书中的例子。 平面上有一单位圆,随机地画一条弦,求弦长大于此圆的内接等边三角形之边长的机率。 利用几何,单位圆的内接等边三角形之边长可求出。 但如何是随机地画一条弦呢? 要知由1至 $n$ 的 $n$ 个正整数中,随机地取1数,其意义较清楚,就是每一数被取中的机率皆为 $1/n$。 自区间 [0,1] 中随机地取1数,其意义也还明白,就是此数会落在 [0,1] 之任一子区间的机率,为该子区间之长度。 但随机的画弦,是如何画法? 此处对于“随机”一词,可以有好多种解释。 解释不同,画弦的方式将不同,因而求出的机率也就不同。 可参考黄文璋 (2010b)第二章例 5.3。

上面这几个例子告诉我们,在处理机率问题时,情境要定义清楚。 用术语来说,就是机率空间要明确给出,否则将导致各说各话。 有时虽未给出机率空间,但情境较简单,大家有共同看法,这时未特别强调机率空间为何,还没问题。 如“投掷一公正的股子,求点数大于4之机率”。 虽只是简单的描述,但不至于有疑义。 当对情境有疑义时,就要如庄子在秋水篇讲的,“请循其本”,把机率空间调出来。 此有如政治上或社会上,遇到有重大争议时,就要祭出宪法,看有没违宪,并由大法官解释。 对一给定的情境,要很谨慎的面对。 否则即使是机率统计专业人士,也可能解读错误。

情境解读之外,机率中一些独特的概念,像是条件机率,独立性,及随机取样等,也是应用机率时,得谨慎留意的。 这类概念我们已谈过不少,可参考黄文璋(2003)一书。 至于机率与统计里的一些基本概念,可参考黄文璋(2009)一文。

附注.

  1. 42取6的乐透彩,每签一注,至少中1码之机率为 $$1-\frac{{36\choose6}}{{42\choose6}}=1-\frac{1,947,792}{5,245,786}\doteq0.629\hbox{。}$$

  2. 取样前,每一区间包含 $p$ 之机率为0.95。 故总共包含 $p$ 之区间数 $X$,有二项分布,参数为40,0.95。 因此 $$P(X\leq34)=\sum\limits_{i=0}^{34}{40\choose i}0.95^i0.05^{40-i}\doteq0.01388\hbox{。}$$ 上述值可藉查表或由计算机获得。

  3. 在汽车与山羊问题,你先选了第 1 扇门。 当第 2 及第 3 扇门后皆是山羊,假设主持人分别以 $q$ 及 $1-q$ 的机率,打开第 2 或第 3 扇门,其中 $0\leq q\leq1$。 底下我们来求,在给定主持人打开第 2 扇门且门后是山羊之下,你更换选择,会得到汽车之机率。 令样本空间为 $$\Omega=\{(1,2),(1,3),(2,2),(2,3),(3,2),(3,3)\},$$ 其中 $(1,2)$ 表第 1 扇门后有汽车,且主持人打开第 2 扇门,馀类推。 事件的集合 $\mathcal{F}$,取为包含 $\Omega$ 之所有子集之集合。 又令机率函数 $P$ 满足 \begin{eqnarray*} P(\{(1,2)\})=\frac{q}{3},~P(\{(1,3)\})=\frac{1-q}{3},\\ P(\{(2,2)\})=0,~P(\{(2,3)\})=\frac{1}{3},\\ P(\{(3,2)\})=\frac{1}{3},~P(\{(3,3)\})=0,\end{eqnarray*} 其中 $P(\{(1,2)\})=q/3$,是因汽车在第1扇门后之机率为1/3,且主持人有 $q$ 的机率打开第 2 扇门,二机率相乘即得 $q/3$; $P(\{(2,2)\})=0$,是因若汽车在第2扇门后,主持人必定打开第 3 扇门,馀类推。 则得机率空间 $(\Omega,\mathcal{F},P)$。 主持人打开第 2 扇门的事件为 $$A=\{(1,2),(2,2),(3,2)\},$$ 其机率为 $${q\over3} + 0 + {1\over3} = {1+q\over3}\hbox{。}$$ 更换第 3 扇门,会得到汽车之事件为 $B=\{(3,2\}$,其机率为 1/3。 则 $$P(B|A)={P(A\cap B)\over P(A)}={P(B)\over P(A)}={1/3\over (1+q)/3}={1\over 1+q}\hbox{。}$$ $q=1/2$,就是原先的情况,此时 $P(B|A)=2/3$。 至于两个极端的情况,$q=0$ 及 1,$P(B|A)$ 分别为 1,及 1/2。 此二情况的意义是什么? 以及对应的 $P(B|A)$ 为何是 1 及 1/2? 就留给读者自行想通。


参考文献

  1. 黄文璋 (2003). 随机思考论。 华泰文化事业股份有限公司,台北。

  2. 黄文璋(2005a). 应随机以恒周。 科学发展月刊,394期(2005年10月号): 68-73。

  3. 黄文璋(2005b). 统计显著性。 数学传播季刊,29(4): 29-38。

  4. 黄文璋(2006). 统计里的信赖。 数学传播季刊,30(4): 48-61。

  5. 黄文璋(2007). 统计里的估计。 数学传播季刊,31(2): 3-20。

  6. 黄文璋(2009). 统计思维。 数学传播季刊,33(4): 30-46。

  7. 黄文璋(2010a). 机率应用不易。 数学传播季刊,34(1): 14-28。

  8. 黄文璋(2010b). 机率论,第二版。 华泰文化事业股份有限公司,台北。

  9. Neyman,J. (1934). On the two different aspects of the representative method:  The method of stratified sampling and the method of purposive sampling.The Journal of the Royal Statistical Society,97,558-625.

  10. Rao,C. R.(1997). Statistics and Truth: Putting Chance to Work,2nd ed. World Scientific,Singapore. (第一版有中译本,石坚及李竹渝译(1998)。 统计与真理——怎样运用偶然性。 九章出版社,台北)

  11. Salsburg,D.(2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. W.H. Freeman and Company,New York. (有中译本,叶伟文译(2001)。 统计改变了世界。 天下远见出版股份有限公司,台北)

  12. Sawilowsky,S. S.(2003). Deconstructing arguments from the case against hypothesis testing. Journal of Modern Applied Statistical Methods,2,467-474.

原文链接: https://w3.math.sinica.edu.tw/mathmedia/HTMLarticle18.jsp?mID=35203
作者: 黄文璋 任教国立高雄大学应用数学系
来源: 《数学传播》第35卷 第2期