金融市場的量化密碼系列文章(16)
男孩女孩的悖論
作者:Michael Zhang 麥教授
如果世界中的事件完全不可預測地随機發生, 則我們的生活是無法忍受的。 而與此相反, 如果每一件事都是确定的、完全可以預測的, 則我們的生活是無趣的。
——統計學家C.R.Rao
雖然很多概率論問題的推導可以很複雜,但是對概率的理解其實隻要抓住一點就可以,那就是從所有可能的結果中數清楚各個事件發生的比例。聽上去很簡單,但是其實并不簡單。我們來測試一下:如果記錄連續投擲10次硬币的過程,下面哪個記錄出現的概率更大一些?
記錄一:正,正,正,正,正,正,正,正,正,正
記錄二:正,反,反,正,正,反,正,反,反,正
很多人會說是記錄二,然而兩個記錄出現的概率是一樣的。記錄二可能看上去更可信一些,但是兩個記錄都是每次這一面出現的概率是1/2,連續投擲了10次,它們出現的概率都是1024分之一。換句話說,“所有可能的結果”一共有1024種,而這兩個記錄都是1024種結果中的一種,它們出現的概率是相同的。
有個非常反直覺的概率問題叫做兩孩問題(two-children problem,也叫男孩女孩悖論,Boy or Girl paradox)。如果不是對概率論深刻理解了,兩孩問題會是個非常困擾人的悖論。
這個問題最早是在1959年10月版的《科學美國人》數學遊戲專欄中提出的。問題的内容是:
第一個問題很簡單,這兩個孩子的出生是獨立的,所以第二個孩子可能是男孩也可能是女孩,所以第二個孩子是男孩的概率是1/2,于是兩個孩子都是男孩的概率就是1/2。
第二個問題初看和第一個問題一樣,告訴我們其中至少一個是男孩,兩個小孩的出生應該是獨立的,所以另外一個小孩可能是男孩,也可能是女孩,概率難道不是和之前一樣是1/2嗎?
然而正确答案其實是1/3。
這道題的解答需要對概率的定義深刻理解,也就是之前費馬和帕斯卡探讨的概率最簡樸的意義:從所有可能的結果中數清楚各個事件發生的比例。
我們先把第一個問題的所有情況列出來:(女,女;女,男;男,女;男,男)括号裡用分号表示不同的情況,用逗号分開老大和老二。
可以看到,已知老大是女孩,所以第三和第四種情況都可以排除了,問題變成(女,女;女,男)第一和第二種情況各占一半的機會,所以老二是女孩的概率是1/2。
下面看第二個問題:(女,女;女,男;男,女;男,男),但是已知至少有一個是男孩,所以(女,女)是不存在的,問題變成(女,男;男,女;男,男)。
在剩下的三種情況中,有一種是兩個都是男孩的情況,所以從概率上講,發生這件事的概率是1/3。同理,老李的孩子是一男一女的概率也不是50%,而是2/3。
每被問到“有兩個孩子,其中至少有一個是男孩”這個問題時,人們基本的直覺就會引導人們得出另一個孩子是男孩或女孩的概率是50%,因為另一個孩子可能是男孩或女孩(基于存在兩種同樣可能的結果的假設)。然而,這并沒有“從所有可能的結果中數清楚各個事件發生的比例”。
這個問題也可以換一種方式來理解(用頻率學派的思想)。想象100個家庭,每個家庭有兩個孩子,那麼我們會遇到的三種情況是:
A) 25個家庭有兩個女孩
B) 25個家庭有兩個男孩
C) 50個家庭有一男一女
由于我們被告知他們中至少有一個是男孩,我們就要把兩個都是女孩的情況先排除。這樣我們的“所有可能的結果”中就隻有75個家庭(25 50),其中隻有25個家庭的兩個孩子都是男孩。因此,有兩個男孩的家庭的概率為25/75=1/3。
下面我們來看看是否真的理解了什麼是“所有可能的結果”。
繼續推演,假設老李改口說“我有兩個孩子,至少有一個是男孩,他名叫小明”,那麼兩個孩子都是男孩的概率是多少?和問題二相比,隻是多了個名字,難道會改變結果嗎?
還真的可以改變。
首先像之前一樣排除兩個女孩的情況,然後寫出所有可能的結果:(小明,男;男,小明;女,小明;小明,女)。這裡排除了兩個男生都叫小明的情況,可以看到,現在另一個孩子有2種情況是女孩,另外2種情況是男孩,所以另一個孩子是男孩的概率就是50%了(而不再是1/3)。
我們還可以繼續推演,這次老李說:“我有兩個孩子,其中至少一個是男孩,他是星期二出生的”,那麼兩個孩子都是男孩的概率是多少?和問題二相比,隻是多了這個男孩是星期二出生的,難道會改變結果嗎?
非常詭異的是,還真的可以改變。而答案是你絕對猜不到的13/27。
直覺上,人們可能會說另一個孩子是男孩的幾率是1/2或者是1/3,因為直覺上不應該根據出生日期有任何變化。
然而,假設一個孩子在一周中任何一天出生的可能性都是一樣的,這就導緻了以下27種同樣可能的孩子出生方式:
男2女1, 男2女2, 男2女3, 男2女4, 男2女5, 男2女6, 男2女7,
女1男2, 女2男2, 女3男2, 女4男2, 女5男2, 女4男2, 女7男2,
男1男2, 男2男2, 男3男2, 男4男2, 男5男2, 男6男2, 男7男2
男2男1, 男2男3, 男2男4, 男2男5, 男2男6, 男2男7
上面的列表中我們把星期幾表示為1、2、3.... 7(1為周一,2為周二,以此類推),也就是說,周二出生的男孩表示為“男2”,周一出生的女孩表示為“女1”。
27種可能裡,前兩行(有14種情況)包括一個女孩。而後兩行(有13種情況)是有兩個男孩的情況,所以兩個都是男孩的概率變成了13/27。
可以看到,要想計算正确,首先要像費馬和帕斯卡一樣,需要在“所有可能的結果中數清楚各個事件發生的比例”。
這個問題還可以繼續推演,老李還可以說:“我有兩個孩子,其中至少一個是男孩,他是元旦出生的”,“我有兩個孩子,其中至少一個是男孩,他是2月29号出生的” 。。。
我們可以得出一個結論:老李這個老頭子壞得很,這樣的叙述方法下,兩個孩子都是男孩的概率總歸都不是50%。
▼金融市場的量化密碼系列文章▼
金融市場之投資與随機變量
金融市場之概率起源
他是一個有缺點的偉人,如果沒有這些缺點,他将是完美的怪人
博和弈:圍棋、輪盤賭與股票投資
量化交易的三個必要條件
人工智能的三個必要條件
投資、投機與套利
金融的不确定性(1929年)
科學裡的不确定性:上帝擲骰子嗎?
從印象派畫作說起,如何理解藝術裡的“不确定性”
獲得真知的第一步,是走向未知
金融市場無限的未知裡,有着無限的可能
從不同的角度思考和解決問題,真理也會成為假命題
如何用兩維思維方式解讀蘇格拉底悖論
不可能發生的事(1987年)
《金融市場的量化密碼》系列專欄——前言
▼往期精選▼
一篇文章講明白:SPAC上市熱潮
有骨氣的基金經理都跳樓了
一篇文章講明白:女版巴菲特和她的ARK基金
一篇文章講明白:150億爆倉風波
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!