自然界中存在大量的正态分布,比如女性的身高:
(圖源網絡)
正态分布的英文名為:Normal Distribution,台灣翻譯為常态分布,可見一斑。可是為什麼這麼常見呢?
每個人都相信它(正态分布):實驗工作者認為它是一個數學定理,數學研究者認為他是一個經驗公式。
----加布裡埃爾·李普曼
1 高爾頓釘闆
弗朗西斯·高爾頓爵士(1822-1911),查爾斯·達爾文的表弟,英格蘭維多利亞時代的博學家、人類學家、優生學家、熱帶探險家、地理學家、發明家、氣象學家、統計學家、心理學家和遺傳學家。
他發明了一個叫做高爾頓釘闆的裝置,展示了正态分布的産生過程:
1.1 細節
我們來看看高爾頓釘闆的細節,或許有助于我們理解正态分布為什麼常見。
彈珠往下滾的時候,撞到釘子就會随機選擇往左邊走,還是往右邊走:
一顆彈珠一路滾下來會多次選擇方向,最終的分布會接近正态分布:
1.2 扯淡
自然界中為什麼會有那麼多正态分布?下面開始胡謅了。
比如開頭提到的女性身高,受到多個因素的影響,比如:
這些影響,就好像高爾頓釘闆中的釘子:
要不對身高産生正面影響,要不對身高産生負面影響,最終讓整體女性的身高接近正态分布。
中心極限定理說了,在适當的條件下,大量相互獨立随機變量的均值經适當标準化後依分布收斂于正态分布,其中有三個要素:
每次采樣受到各種随機性的影響,就好像釘闆中的釘子,對采樣結果進行或者正面、或者負面的影響,最終讓結果形成了正态分布。
高爾頓釘闆還有兩處細節:
2 為什麼還有很多不是正态分布?
在醫學研究中很多分布就不是正态分布,對實施了前列腺癌症治療的病人進行前列腺特異性抗原(Prostate specific antigen)的檢測,檢測結果的分布不是正态分布:
這裡可能有兩個原因導緻了這一現象。
首先,樣本取自實施了前列腺癌症治療的病人,這些病人往往有各種各樣的疾病,并不是全體人類樣本,也就是說不夠随機,所以結果很可能會偏向某一邊。
其次,癌症并非是相加,癌細胞的分裂更像是乘法:
數學中,可以通過對數來把乘法變為加法:
因此我們對之前的數據取自然對數,結果就接近于正态分布了(這就是對數正态分布):
看上去還有點偏向左邊,或許是因為采樣不是取自全體人類,導緻随機性不夠。
以上數據及圖片來自于《What is a p-value anyway? 34 Stories to Help You Actually Understand Statistics》。
财富分布也是有乘法效應在裡面,這就是所謂的“馬太效應”:
多說幾句自己的感想吧,對于财富分布,我們大家肯定都希望自己往橫坐标的右側靠近。
那麼在每次碰到釘闆中的釘子時,都需要做出往左走還是往右走的選擇,所以我們需要努力提高自己,使自己的選擇比扔硬币的正确率高,減少随機性,這樣才能盡量往右走。
以後回答為什麼要學習?
“因為正态分布啊!”
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!