tft每日頭條

 > 生活

 > 概率與統計的随機思想

概率與統計的随機思想

生活 更新时间:2024-09-03 17:23:00

導讀:"概率與我們的生活息息相關,因此若能善用概率,将有助于在随機世界中,更精準地做決策。"

本文是我國台灣著名數學家黃文璋撰寫的一篇關于概率與統計的文章。文章通過大量日常生活例子,深入淺出地介紹了概率的意義以及常見應用誤區。文章編輯過程中略有删減。

概率與統計的随機思想(随機世界與大數法則)1

00 導語

1987年,是印度傳奇數學家拉曼努揚(Srinivasa Ramanujan,1887-1920)的百年誕辰。為了紀念他,有一系列的活動。當代著名統計學者,出生于印度的勞氏(C. Radhakrishna Rao,1920),也應邀做了三場演講。

之後,印度統計學研究所(Indian Statistical Institute)基于勞氏的演講稿,于1989年,為他出版了《統計與真理》一書。此書于1997年發行第二版。

在第一版的序文中,勞氏提到:

學生時代,我主修數學一種從給定前提下演繹結果的邏輯。後來我念統計學一種從經驗中學習的理性方法,及從給定的結果驗證前提的邏輯。我已認識到數學及統計,在人類為提昇自然知識,及有效管理日常事務所做的一切努力中,占有重要性。

我相信:

在最終的分析中,所有知識皆為曆史

在抽象的意義下,所有科學皆為數學

在理性的世界裡,所有判斷皆為統計

這一段話,大緻說明數學及統計的重要性,及其各自的内涵。

翻開統計史,“信賴區間”是另一著名統計學者,出生于波蘭,1938年才移民至美國的奈曼(Jerzy Neyman,1894-1981),于1934年演講中首度提出。他的演講結束後,大會主席包雷(Arthur Lyon Bowley,1869-1957)于緻詞中對此持懷疑态度。

要知奈曼信賴區間的概念剛提出時,大部分的統計學者,包括被視為是現代統計學之創始者,英國的費雪(Sir Ronald Aylmer Fisher,1890-1962,常以R.A.Fisher稱之)均難以接受。

在所謂95%信賴區間中,那95%究竟是指什麼?是概率嗎?如果是,那又是什麼的概率?雖奈曼取巧地以“信賴區間”來稱呼此一他創造出來的東西,而避用概率一詞。但包雷及其同行,當然一眼便看穿這個手法。

歲月匆匆,七十多年過去了,今日統計學家,當然已完全弄懂信賴區問的意義。對不同的參數,不同的分布,可有不同的信賴區間;即使同一參數且同一分布,也可以不同的方法,得到不同的信賴區間。

有時因條件不足,或計算複雜等原因,隻好退而求其次,得到近似的信賴區間。當然這時需要一些條件,及利用一些定理。信賴區間亦可比較優劣。要知統計裡有各種推論方法,但因處理的是随機現象,少有“倚天既出,誰與争鋒”的方法。

而評比時,也要訂出評比準則。否則就像有個停止不動的鐘,及一每日慢1分鐘的鐘,如何判定何者較準?前者可是每日皆有完全準确的時刻,後者卻是每1440天(一天有1440分),才有一完全準确的時刻。不講清楚如何評比,将會各說各話。

追根究底,還是不少學習者,未能正确了解概率的含義。

概率與統計的随機思想(随機世界與大數法則)2

01 認識概率

1. 古典概率

一骰子有6個面,一擲之下,會得到偶數之概率為何?骰子看起來沒有異樣,就假設每個面出現的概率皆相同,即均為1/6。而偶數面有2,4,6共3個。因此所求之概率為3/6。

這就是所謂的古典概率,基本假設是“相同的可能性”。先求出觀測的現象共有幾種可能,再求出其中有幾件是我們有興趣的。将後者除以前者,即為所要的概率。

雖說是“古典”,這種概率的意義,至今仍處處可見。采用的範圍包含諸如抽簽、玩撲克牌,及玩樂透彩等。又如某項工作征才,報名的有82人,錄取5人。若沒有什麼特别的資訊,便隻能假設每人被錄取的概率皆相同,即皆為5/82。

2. 頻率

2009年7月底8月初,世界高爾夫球王老虎伍茲(Tiger Woods)參加在美國密西根州舉行的别克公開賽(Buick Open)。第1輪打完,落後領先者多達8杆,排名并列95。引發他可能難逃職業生涯首次連續2場比賽提前被淘汰的話題。不過老虎畢竟不能小觑,打完前3輪後,伍茲躍居首位。

這時大家看法不變,一緻認為這座冠軍杯,幾乎可說是他的囊中物了。因過去的紀錄顯示,伍茲如能帶着54洞領先進入決賽圈,戰績是35勝1敗。你要不要猜後來他赢了沒有?

運動比賽,往往有過去資料可參考,此時相同的可能性便不宜用了。36次中成功35次,“相對頻率”為35/36(約0.972)。這種以相對頻率來解釋概率,是常有的作法。适用能重複觀測的現象。

會不會有爆出冷門的時候?當然有。隻是對一特定事件,用過去多次同樣情況下,該事件發生的相對頻率,來估計下一次事件發生的概率,乃是在沒有更多資訊下,常被認為一屬于客觀的辦法。

3. 主觀概率

某君看上一女孩,驚為天人,覺得這是他今生的新娘。評估後信心滿滿,自認追上的機會有8成。旁人卻都不看好,問他8成這一數字,是如何冒出來的?該君舉證曆曆,一個又一個的迹象,顯示那女孩對他很有好感。這個0.8的概率,就是所謂主觀概率

概率與統計的随機思想(随機世界與大數法則)3

02 概率的意義

主觀概率當然也可基于過去一些客觀的事實。隻是即使面對同樣的資料,不同的人,可能有不同的判定,因而給出不同的主觀概率。看過《他其實沒那麼喜歡你》(He's Just Not That Into You)嗎?片中那個叫Gigi的女孩,便常誤解男生所透露的訊息。

有些現象就是不能重複觀測。如核能電廠的意外,及彗星撞地球等。以追女孩為例,大約少有女孩,會讓你做實驗,反複地追,然後數一數其中成功幾次,來定下她會被你追上的概率。對這類無法重複觀測的現象,在談概率時,主觀概率就常派上用場。

每天早上出門,我們不是慣于擡頭看天,判斷一下今天下雨的概率有幾成?隻是往往父母認為的概率會大些,該帶傘,而小孩所認為的下雨概率會小些。

雖說“主觀”,但仍要合理。例如,考試有及格與不及格。若認為會及格的概率為0.9,這沒問題,人總要有點自信,但若又同時擔心有0.8的概率會不及格,那就不行了。

各種可能性發生概率相加要為1。即使是主觀,可以獨排衆議,仍須自圓其說。不能說,既然是主觀,便可以任意自定各事件之概率。因此不論是那一種對概率的解釋,都自然地,或說必須要滿足一些共同的規則。這點大家應能理解。

上述三種是常見對概率的解釋,大抵也就是人們評估事件發生可能性之大小的幾種思維。雖是針對不同的情況,但常能交互着運用。

大家都聽過曾參殺人的典故吧。有個與曾子同名的人殺人,好心者告訴曾母“曾參殺人”。曾母說“吾子不殺人”,繼續織布。過一會兒,又有人來說“曾參殺人”。曾母仍繼續織她的布,這麼好的兒子怎可能殺人?但當第三人跑來說“曾參殺人”,曾母就害怕了,丢掉織布器具翻牆而逃。所謂“其母懼,投杼踰牆而走”。這故事出自《戰國策·秦策二》。

因此當拿到一銅闆,可主觀地認為,政府發行不該會有偏差,兩面出現的概率,應皆為1/2(這也可以是基于相同可能性之想法)。若投擲10次,正面出現8次,可能覺得有些奇怪。若繼續投擲,結果100次中,出現80個正面,這時相對頻率的觀點,很可能便将顯現。類如曾母,調整看法,不再認為此銅闆公正。

當然,你可以不信邪,不論投擲的結果如何,皆認為那隻是短暫的情況,意志堅定地認為這是一公正的銅闆。這并沒有不行,就像會有母親,即使再多的人證,隻要她沒親眼看到,她就不信兒子會殺人。

要知随機現象,事件隻要概率為正,不論概率值多小,便皆可能發生。畢竟銅闆正面出現的概率為何,隻有天曉得。

但引進概率與統計,乃為了協助我們做決策可以更精準。而決策可以與時推移,并非不能更改。有如氣象局對台風會帶來多少雨量,須密切掌握新的動向,而随時修正。

要有随機的思維,如前言中勞氏所說的,從給定的結果,驗證前提。因此針對100次投擲,出現80個正面,多數人面對此結果,還是會認為0.8的正面出現概率,較0.5的概率可信。稍後我們會再來看,10次中的8次,與100次中的80次,相對頻率同為0.8,但提供的資訊,是否有異?

概率與統計的随機思想(随機世界與大數法則)4

雖然已有上述三種對概率的解釋,也涵蓋了不少實際生活中所遇到的情況,數學家當然不會在此止步。他們喜歡抽象化,及一般化。像解方程式,會尋求公式,以表示出某類方程式的解,而非隻滿足于求出一個個的特例之解。

又如當完全了解實數系統後,便會以公理化的方式,定義實數系統。即給一集合,沒說是數字的集合,對其中的元素定義二運算,并給出10條遵循的公理(axiom,規則)。你好奇該二運算是否一為加法,一為乘法?而怎麼沒有減法與除法?名可名,非常名,數學家不認為你提出的是重要的問題。

但用心體會後,你終于發現原來二運算,其一等同于加法,其二等同于乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1。數學家對你的洞察力,仍不以為意,但同意你可以這樣想。

什麼叫以公理化的方式,來引進概率?先要有一個集合,稱做樣本空間,當做某一觀測之所有可能結果的集合。可以真的有這一觀測,或隻是虛拟的。樣本空間的某些子集合,是我們有興趣的,這些就是一個個的事件。

所有事件也構成一集合。最後定出一概率函數,即對每一事件,給一介于0,1間的值,為該事件之概率。樣本空間、事件的集合,及概率函數,三者便構成概率空間(probability space)。這其中對樣本空間沒有太大要求,但不可以是空集合。而事件的集合,要滿足若幹條件。

簡單講,就是你有興趣的事件不能太少。譬如說,不能隻對某事件A發生有興趣,卻對A不發生沒興趣。因此事件的集合要夠大,至少該有的都得納入。

這有點像婚宴前拟賓客名單。可以請很少人,如隻有雙方家長。而一旦多列了某人,與他同樣親近的人便也要一并請。所以每多列1人,将不隻是增加1人而已,而會随之增加幾位。概率函數既然以概率之名,當然要符合過去大家對概率的認知,滿足一些基本的條件。

在概率空間的架構下,不論采用何種方式解釋概率的人,都可各自表述,找到他所以為的概率意義。但因抽象化後,不再局限于銅闆、骰子,及撲克牌等,便能讨論較一般的問題,有夠多的理論可挖掘。

與數學的其他領域相比,概率論的發展是較晚的。但公理化後,概率論便快速地有了深而遠的發展,并成為數學中一重要的領域。這都要歸功于二十世紀那位重要的概率學家,俄國的科莫果洛夫(Andrey Nikolaevich Kolmogorov,1903-1987)1933年出版的那本不到100頁的小書《概率論的基礎》(Foundationsof the Theory of Probability)中所奠定。在此書中,他說:

概率論作為數學學科,可以而且應該從公理開始發展,就如同幾何、代數一樣。(The theory of probability as mathematical discipline can and shouldbe developed from axioms in exactly the same way as Geometry and Algebra.)

概率與統計的随機思想(随機世界與大數法則)5

03 何處是概率天地

有法國牛頓之稱的拉普拉斯(Pierre-Simon Marquis de Laplace, 1749-1827)曾說:

這門源自考慮賭博中的機運之科學,必将成為人類知識中最重要的一部分,生活中最重要的問題中的大部分,都将隻是概率的問題。

概率是針對随機現象。但世上并非每件事都是随機的,我們說過還有必然性。假設投擲一兩面皆是人頭的銅闆,并觀察會得到哪一面。你曉得這是一必然現象,但仍可說會出現人頭的概率為1,而其他情況出現的概率為0。也就是視此為一“退化的”随機現象

某些物理學家,說不定認為,對投擲銅闆,由給定投擲的速度、角度、地面的彈性、銅闆的形狀及重量等條件,可算出銅闆落地後,會那一面朝上,因此這不是随機。至于樂透彩的開獎,隻要起始條件都能測出,則會開出那一号球,也能算出,因此這也不是随機。

但你大約也知道所謂蝴蝶效應(butterfly effect)。測量極可能有誤差,而有時一些微小的改變,影響卻可能很大。因此我們甯可相信這些都是随機現象。

某些神學家,可能認為一切其實都是按照神的旨意在進行,隻是我們不知而已。說不定真是如此。你看過《傑遜王子戰群妖》(Jason and the Argonauts)嗎?這是一部基于希臘神話的電影,内容與十二星座中的牡羊座有關,1963出品。我雖是幼時看的,至今仍印象深刻。

片中傑遜王子遭遇的各種突如其來的災難,以及一次又一次英勇的逢兇化吉,不過是天後赫拉(Hera),與天神宙斯(Zeus)在較勁,分别作梗及協助。但若無從了解神的旨意,對于未來,也隻好視為随機。

随着科技進步,人們逐漸弄明白很多現象的來龍去脈。例如,我們知道女性一旦懷孕,嬰兒性别便已确定。但對一大腹便便的婦女,好事者由于不知,仍可猜測其生男生女之概率。

考試前夕,學生們雖認真準備,但還是絞盡腦汁猜題,各有其認為考出概率很大的題目。老師獲知後,覺得好笑。課堂中已一再暗示明示,哪些題會考,幾乎都該能确定了,何需再猜?實則試題早已印妥,而學生不知考題,且未體會老師的暗示及明示,所以仍可以大猜一通。

另外,諸如門外有人敲門,你好奇是男是女?老師要你猜拿在背後的水果,是橘子或蘋果?同學蓋住落地的銅闆,要你猜正面或反面朝上?這類明明已确定的事,本身其實并不随機,隻是對你而言,卻有如惠子在秋水篇所說的“子非魚”,當然可猜魚快樂的概率。

但對已命好題目的老師,去判斷那一題會考出的概率,就沒什麼意義了。因對他而言,每一題會考出的概率,隻有1或0,不會是其他值。同樣地,對看到背後水果的人,水果會是橘子或蘋果的概率,将隻能說1或0。

随機與随意不同。我們說過了,概率中那套邏輯,是有夠大的彈性,讓人能揮灑,隻是仍要合理,否則就是擡杠了。若你明明知道那是蘋果,硬要說它是橘子的概率為0.5;或明明已從醫生處掌握一切訊息的待産媽媽,還說生下來是男是女的概率皆為0.5,那就不是在談概率了。

概率與統計的随機思想(随機世界與大數法則)6

04 解釋概率

前文我們以概率空間的方式引進概率。由于樣本空間可以是虛拟的,此時事件也就是虛拟的。但假設真的有一項觀測,如投擲一個4面體,4面分别标示點數1,2,3,4,并觀測所得點數。則樣本空間為1,2,3,4之集合。

事件的集合可以取那一個最大的,也就是包含樣本空間之所有子集所構成的集合。你如果學過排列組合,便知此最大的事件集合中,共有16(2的4次方)個元素。

至于概率函數,假設點數1,2,3,4出現的概率,分别為0.1、0.2、0.3,及0.4,相加為1。至于任一事件的概率,就看該事件包含1,2,3,4中那幾個數,再把對應的概率相加便是。如一事件中恰包含2,4,則該事件的概率為0.2 0.4=0.6。以此類推。這就建立了一概率空間。對同一樣本空間,可定義出很多不同的概率空間。

就算你已接受了概率空間的概念,反正數學家就是常給一些自得其樂的定義,仍可能會好奇,所謂點數1出現的概率0.1,究竟是什麼意思?是每投10次,點數1恰出現1次嗎?非也!

有個修過概率論的數學系畢業生,好心地對你解釋如下:

假設投擲n次,點數1出現a次,則相對頻率a/n與0.1之差的絕對值,會大于一給定的正數(不管它多小)之概率,将随着n的趨近至無限大,而趨近至0。

概率與統計的随機思想(随機世界與大數法則)7

務實的你,很可能不覺得這樣的解釋很實際。先提出疑問“什麼是趨近至無限大?”就是一直投擲,不可停止,日出日落,春去秋來,繼續投擲,即使誇父追日成功了,無限大也仍未達到,還得投擲。

那位數學系畢業生,一聽到你問起無限大,如魚得水,這是他在數學系四年寒窗,學到的幾招獨門絕活之一。你不得不停止無限大這個話題,因連誇父追日,你也覺得豈有成功時?如何能接受解釋概率,還得涉及無限大?但還一點你不吐不快的是“我就是不了解概率值的意義,怎麼卻用概率的概念來解釋給我聽?”

想解釋概率值的意義,将會在概率及無限大,一層又一層的打轉。這有如想去定義什麼叫做點,結果将如同陷在線團中,學步維艱。最後隻好說,點是無定義名詞。

但無論如何,你應可理解,對前述4面體,僅投擲1次,是無法顯示點數1出現概率0.1,那個0.1的意思。概率并非隻看“少數幾次”的結果。概率是在大樣本(n很大)下,威力才顯現。概率值的意義,既然不能以一套可接受的邏輯來說明。

那麼退而求其次,可否讓人略微了解概率值的意思?或者說(除非是虛拟,隻是在求一些概率值),你拿一4面體,且宣稱點數1出現的概率為0.1,怎麼樣才知道你講的是真的,而非信口開河,或者說記錯。

之前那位數學系畢業生的解釋,這時便能派上用場。此即大數法則(law of large numbers)之一簡單的版本。數學上的意思為,事件出現的相對頻率,會“概率收斂”至事件發生的概率。

要知随機世界中,仍有些法則要遵循,大數法則是其中很重要的一個。當然我們已指出了,實際上并無法觀測事件無限多次。那是否可說,事件出現的相對頻率,當觀測數夠大,須接近事件發生的概率?

也非如此。事件隻要概率為正,便都可能發生。所以,不論觀測數再大,都不能排除很偏頗(如觀測1 000 000次,點數1出現的次數為0,或1 000 000次)的事件發生。

但是,這時統計學家跳出來了,可以做一檢定,檢定點數1出現的概率是否真為0.1,這是屬于統計學裡假設檢定(testing hypothesis)的範疇。

簡單講,是以在某一假設下,會觀測到這樣的結果,是否算不尋常?所謂不尋常,是指發生的概率很小,小于某一預設的值。若屬于不尋常,則當初的假設就不宜接受。

附帶一提,當假設一銅闆為公正,則投擲100次,出現至少80次正面,較投擲10次,出現至少8次正面,前者是更不尋常的,因它發生的概率,遠比後者小。所以,在同樣獲得八成以上的正面數下,投擲數愈大,将會使我們更相信此銅闆非公正,而接受它出現正面的概率,至少是0.8。

這說明:在統計裡,樣本數愈大,将使我們的推論愈精準。

在随機世界,究竟何者為真,常屬未知。我們往往無法“證明”那件事是真實的。不過是一個個的假設,端看你接受那一假設。四面體點數1出現的概率,是否真為0.1,即使投擲再多次,都無法證明其真僞。隻能說數據顯示“可以接受”,或“無法接受”概率為0.1。這裡面有一套機制,以決定接受或不接受。

另外,對一四面體,也可估計點數1出現的概率,有一些不同的估計法,可以得到不同的估計量。在數學中,使用不同的方法,須導緻相同的結果。所謂殊途同歸。但統計裡,除非做些限制,否則常無定于一尊的方法。

對不可測的未來,我們常要做估計,統計在這方面,能扮演很好的角色。諸如銅闆出現正面的概率,及病人的存活率等,皆能估計。但有時覺得以一個值估計,雖然明确,但估計值很難恰好等于真實值,一翻兩瞪眼,常估計不準。信賴區間的概念,因而産生。

概率與統計的随機思想(随機世界與大數法則)8

05 信賴區間

我們常對某一未知的量做估計。未知的量可以是某事件發生的概率,某分布的參數(如期望值及變異數等),或某物件之壽命等。這些未知的量,可通稱為參數

有時會以一區間來估計參數,并給出此區間會涵蓋該參數之概率。這就是所謂區間估計,所得的區間,稱為信賴區間。而區間涵蓋參數之概率,則稱為此區間之信心水準(confidence level)。

與概率一樣,信心水準是一介于0,1間的值,常事先給定,且以百分比表示。90%、95%、99%等,都是常取的值。

數據(data)是統計學家做決策之主要依據。若缺乏數據,他們往往将一籌莫展。來看一簡單且常見的情況。假設欲估計一銅闆出現正面之概率p。很自然地,便投擲若幹次,譬如說n次,并觀測n次的結果。這個過程便稱為取樣。

在本情況中,各次投擲的結果并不重要。總共得的正面數,以a表之。知道a,就已掌握全部資訊,a稱為充分統計量(sufficient statistic)。給定信心水準,并利用n及a,可得一信賴區間,但作法并不唯一。亦即對于p,有不同的信賴區間公式。但課綱的寫法,好像信賴區間的公式唯一。

此處由于其中涉及二項分布,計算複雜些,如果n夠大(n太小則不行),我們常可藉助常态分布來近似。這要用到概率論裡另一重要的法則——中央極限定理(Central limit theorem)。必須一提,隻有以常态分布來近似時,才需用到中央極限定理,并非求信賴區間皆要用到此定理。

對估計銅闆出現正面之概率p,取樣前,信賴區間為一随機區間,若信心水準設定為95%,則有(或精準地說“約有”,如果該信賴區間隻是近似的)0.95的概率,信賴區間會包含p。取樣後,得到一固定區間。則p會屬于該區間的概率,将不是1便是0,而不再是p了。為何如此?很多人對此常感困惑。

我們先以下例來說明。假設某百貨公司周年慶,顧客購物達一定金額,便能自1至10号中抽1彩球。若抽中5号,今天在該公司的花費,可獲30%抵用券。在抽球之前,你知道有0.1的概率能獲抵用券,機會不算小。一旦抽出,一看是3号,獲抵用券的概率當然便是0了。

這類例子很多。棒球比賽中,打擊手揮棒前,可以說打出安打之概率為0.341,打完不是安打就非安打,0.341已派不上用場了。

再給一例。假設某銀行發行的樂透彩,每期自1至42号中,開出6碼為頭獎号碼。你簽了一注6碼,開獎前,你知道很容易“至少中1碼”,因概率約為0.629。等開獎後,你的彩券會至少中1碼之概率,将是1(若至少中1碼),或是0(若1碼皆未中)。

再看如課綱中所說,也可以亂數表模拟出現正面概率為p的銅闆n次,以求得信賴區間。你看,p根本是事先設定,模拟所得之一固定區間,p有沒有落在其間,一看便知,如何能說該區間涵蓋p之概率為0.95?

就算你不是模拟,而是實際拿一銅闆投擲,則p隻是未知,卻為某一定值(說不定發行銅闆的單位知道),投擲後所得之固定信賴區間,已無随機性了,它隻會涵蓋p,或不會涵蓋p。可以這樣想,對同一銅闆,每人所得之95%信賴區間有異,如何能個個皆宣稱,其區間涵蓋p之概率為0.95?

那95%有何用?0.95是一概率值,而概率值從來就不是隻看一次的實驗結果。大約可以這麼說,如果反覆實驗,而得到很多信賴區間,則其中會包含p的信賴區間數,約占全部區間數的95%。所以,0.95的意義,乃如同前文我們對概率的解釋。

但要留意的是,對同一個p,如果全班40人,所得到的40個95%信賴區間,其中包含p的個數未超過85%(即未超過34個),也不要太驚訝。此概率約為0.01388(附注2),是不太大,但隻要班級數夠多,便不難發生。課綱說“大多數學生所得的信賴區間都會涵蓋p”,實在缺乏随機的概念。

概率與統計的随機思想(随機世界與大數法則)9

06 情境解讀

概率既然與我們的生活息息相關,因此若能善用概率,将有助于在随機世界中,更精準的做決策。隻是卻往往概率應用不易,得到的概率值,常被認為是錯的。而且還衆說紛纭,各提出不同的概率值。個中原因何在?一主要原因,即情境解讀有誤。

過去大家在數學課程中,會遇到所謂應用題。題目看懂,寫出數學式子後,就是解數學了。這時便可抛開原先那段冗長的叙述。但在概率裡,有些看似簡單的情境,因解讀不同,會導緻南轅北轍的結論。底下給幾個例子來看。

在電影《決勝21點》中,那位數學教授于課堂上提出一個問題。有3扇門,其中1扇門後有汽車,另兩扇門後為山羊。你選擇第1扇門後,主持人打開第2扇門,見到山羊。問你這時該不該換選第3扇門?有位學生答:

Yes, because my chance of getting the car will increase from 33.33% to 66.67% by switching from door 1 to door 3.

教授則說“Very good!”,認同其看法,也就是該換。有些人對此提出質疑。

比較正确的講法應該是,若主持人事先知道汽車在那扇門後,則他會打開1扇門後是山羊的門(這是較合理的作法,否則遊戲便無法進行了),這時若換選第3扇門,則如電影中那位學生所述,得到汽車的概率,将由1/3增加為2/3。

但若主持人事先不知汽車在那1扇門後(這當然是少見的情況),隻是随機地自第2及第3扇門中,挑一扇打開,且剛好門後是山羊,則便不用換,因換或不換,得到汽車之概率,皆為1/2。

但是讀者不知是否注意到,在主持人事先知道汽車在那一扇門後的情況中,我們其實還隐含做一假設。即若第2及第3扇門後皆是山羊,則主持人乃随機地(即各以1/2的概率)打開第2或第3扇門。

事實上,可以有更一般的假設。當第2及第3扇門後皆是山羊,假設主持人分别以q及1/q的概率,打開第2或第3扇門,其中0≤q≤1。則換選第3扇門,得到汽車的概率成為1/(1 q)。原來此概率會受主持人是如何打開第2扇門的影響!很多人可能未想到這點。由于1/(1 q)≥1/2,所以換,仍是較好的選擇。

概率與統計的随機思想(随機世界與大數法則)10

再看一例。有一對夫妻剛搬進某社區,大家隻知他們有兩個小孩,并不知性别。某日社區一管理員,見到此家之媽媽,帶着家中一小孩在玩耍。若該小孩是女孩,求此家兩小孩皆為女孩之概率。

很多人以為此問題不難,認為所求概率就是1/3。其實此問題比我們想像的複雜很多。關鍵在如何将“見到此家之媽媽,帶着家中一女孩”,轉化為适當概率空間中的事件。也就是要講清楚,究竟如何帶小孩出門?要注意的是,前述事件并不等同于“此家至少有一女孩”!

最後看另一常出現于概率論教科書中的例子。平面上有一單位圓,随機地畫一條弦,求弦長大于此圓的内接等邊三角形之邊長的概率。

利用幾何,單位圓的内接等邊三角形之邊長可求出。但如何是随機地畫一條弦呢?要知由1至n的n個正整數中,随機地取1數,其意義較清楚,就是每一數被取中的概率皆為1/n。自區間[0,1]中随機地取1數,其意義也還明白,就是此數會落在[0,1]之任一子區間的概率,為該子區間之長度。

但随機的畫弦,是如何畫法?此處對于“随機”一詞,可以有好多種解釋。解釋不同,畫弦的方式将不同,因而求出的概率也就不同。

上面這幾個例子告訴我們,在處理概率問題時,情境要定義清楚。用術語來說,就是概率空間要明确給出,否則将導緻各說各話。

有時雖未給出概率空間,但情境較簡單,大家有共同看法,這時未特别強調概率空間為何,還沒問題。如“投擲一公正的骰子,求點數大于4之概率”。雖隻是簡單的描述,但不至于有疑義。當對情境有疑義時,就要如莊子在秋水篇講的,“請循其本”,把概率空間調出來。

此有如政治上或社會上,遇到有重大争議時,就要祭出憲法,看有沒違憲,并由大法官解釋。對一給定的情境,要很謹慎的面對。否則即使是概率統計專業人士,也可能解讀錯誤。

情境解讀之外,概率中一些獨特的概念,像是條件概率,獨立性,及随機取樣等,也是應用概率時,得謹慎留意的。

【來源:長江商業評論】

作者:黃文璋

如侵權聯系删

------------

關于小程序開發、運營、代理事宜請留言或聯系作者私聊

豐數雲是專業小程序方案服務商,版本多樣,案例豐富,時刻關注小程序最新動态,提供最優最新的小程序方案,歡迎前來咨詢!

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved