在我們認知地圖裡面有一個定律非常的重要,可以給我們的生活很多有價值的指導,它就是大數定律。這個大數定律也是現代統計學之所以是科學的基礎,今天咱們就聊聊這個大數定律。
1.什麼是大數定律
“大數定律”,是說隻要一件事情發生的次數足夠多,它出現某一個結果的頻率,就會等于概率。正因為有大數定律,我們才可以對事物發生的頻率做出判斷,我們才能通過頻率去推測理論上的概率。如果沒有大數定律,所有的随機實驗、一切通過統計發現事物背後規律的努力,就将變得沒有意義。大數定律又被稱為“黃金定理”,它讓我們真正能用整體的确定性來對抗局部的随機性。
大數定律是由雅各布·伯努利花了20年的時間,基本證明了這個“不言自明”或者說“顯而易見”的結論,之所以說他基本上證明了,是因為他職證明了随着試驗的數量越多,頻率接近真實概率的可能性越大。他沒完成的部分,由前蘇聯數學家、概率論的先驅柯爾莫哥洛夫在雅各布的基礎上,做出了更加嚴密的證明。
2. 現實中的數據都是局部數據
大數據定律想要真正起作用有個限制條件,隻有在數據無限的情況下,随機事件發生的頻率才等于它的概率,試驗次數無限是個數學概念,現實中不可能有無限存在的。當數據量很少的時候,一件事發生的頻率可能和它的真實概率相差很大。
比如如果你有一個完美的硬币,你抛硬币得到正面朝上的概率,就是嚴格的 50%。可是在實際操作之中,你抛 10 次,可能得到 3 次正面,7 次反面。為什麼正面向上不是 50%呢?大數定律說那是因為你抛的次數不夠多,如果你抛一萬次,得到正面的頻率就會非常接近 50%。
再比如,曆史上英國和法國曾經共同研制了一款超音速客機,叫“協和式客機”,1976年投入使用,協和式客機不僅擁有當時最高級别的安全設計,還有當時最高級别的安全保障,在長達24年的飛行中,它沒有發生過一起緻死事故,一度被認為是世界最安全的飛機。直到2000年7月25日,協和式客機出現了一次墜機事故,協和式客機總共飛行了八萬多次,就是因為這一次墜機事故,它的緻死事故率立即從24年來的0上升到了八萬分之一,變成了世界上最危險的飛機,後來這款飛機就被停飛了。
這款飛機真的這麼不安全嗎,其實不一定,因為協和式客機的飛行數據太少了,隻有區區八萬次,它出事故的頻率和真實的事故率之間,可能有很大的誤差。而這個誤差到底有多大呢?那次失事是意外,還是飛機的設計真的有缺陷?八萬分之一的緻死事故率到底比真實概率大,還是比真實概率小?這些我們都無法知道,因為沒辦法讓協和式飛機再飛一億次了。
3.大數定律和“均值回歸”
均值回歸的意思是說,如果一個數據和它的正常狀态偏差很大,那麼它向正常狀态回歸的概率就會變大。大數定律不會對已經發生的情況進行補償,而是利用大量的正常數據,削弱那部分異常數據的影響。正常數據越多,異常數據的影響就越小,直到小到可以忽略不計。打個比方,把一勺糖放在一杯水裡,你會覺得很甜,可是放到大海裡味道幾乎不會有任何改變。就像網上的段子說的五塊錢的瑪莎拉蒂跑車的優惠券一樣。
比如說一位企業家非常厲害,又有錢又有名,可是他的孩子卻沒有他那麼厲害,是個很普通的人,這個現象就是回歸均值。
為什麼會回歸均值?不是說這個企業家把他家族的運氣都給花光了、妨礙了他兒子的發展,也不是說什麼冥冥之中自有天意,要求一個家庭不能把風光占盡 —— 這純粹是一個數學現象,根本原因僅僅是厲害人物的養成需要很好的運氣配合,而好運氣沒有那麼容易發生!
明白了這個道理,再去審視我們的生活,很多現象就好理解了。比如我們經常會說一些俗語,運氣不好的時候,會說“三十年河東,三十年河西”;打牌或者玩遊戲連着輸的時候,會說“否極泰來”。極度的壞運氣過後不一定就有好運氣,而是通過均值回歸,讓運氣回到不那麼壞的正常狀态。
參考資料:
得到app《劉嘉·概率論22講》《吳軍·數學通識50講》《萬維鋼·精英日課》。
(關注、點贊、轉發)(全網同名,書童寒不冷)
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!