0.0 神說,要有正态分布,于是就有了正态分布。*
0.1 神看正态分布是好的,就讓随機誤差都随了正态分布。
0.2 正态分布的奇妙之處,就是許多看似随機事件竟然服從一個表達式就能表達的分布,如同上帝之手特意為之。[1]
——《創世紀·數理統計·正态分布的前世今生》
一、神覺得抛硬币是好的,于是定義每個抛出硬币正面記 1分,反面記-1分。
創世紀從0分開始,神隻抛1次硬币,有2種可能:一半的概率 1分,一半的概率-1分。
此時概率分布大概是這樣的:
一半的概率 1分,一半的概率-1分
畫圖大概是這樣子:
一半的概率 1分,一半的概率-1分
神決定扔10個硬币:
一樣的做出概率分布
當然,同樣畫個圖感受一下:
10個硬币的概率分布情況
如果是100個,甚至是無窮多個呢?平均分數分布情況大概是什麼樣呢?畫個圖感受一下:
二、為什麼正态分布這麼常見呢?
因為通常情況下,一個事物的影響因素都是多個,比如每個人的身高,受到多個因素的影響,比如:
每一個因素,每天的行為,就像剛才抛硬币一樣,這些因素要不對身高産生正面影響,要不對身高産生負面影響,最終讓整體身高接近正态分布。
學過基礎統計學的同學大都對正态分布非常熟悉,但是很難用通俗的語言解釋什麼是正态分布,主要原因是正态分布需要有一個前置知識【中心極限定理】。
如果誤差可以看成許多微小量的疊加,則根據中心極限定理[1],随機誤差理所當然是正态分布[2]。
正經的數學:正态分布又名高斯分布(Gaussian distribution)。
假設一随機變量X服從一個期望為 μ,方差為 σ2 的正态分布,概率密度函數為
正态分布公式
則可記為:X∼N(μ,σ2),畫圖如下圖:
*神的名字是約翰·卡爾·弗裡德裡希·高斯,C.F.Gauss,1777年4月30日-1855年2月23日
[1]正态分布為什麼常見?真正原因是中心極限定理(central limit theorem)。根據中心極限定理,如果一個事物受到多種因素的影響,不管每個因素本身是什麼分布,它們加總後,結果的平均值就是正态分布。
[2]正态分布隻适合各種因素累加的情況,如果這些因素不是彼此獨立的,會互相加強影響,那麼就不是正态分布了。PS:如果各種因素對結果的影響不是相加,而是相乘,那麼最終結果不是正态分布,而是對數正态分布(log normal distribution)
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!