圖1
再進一步:
圖2
注意,這裡已經是将
即随機變量之和作為一個變量看待。對圖1中的分子分母都除以n之後,定理變成:
圖2
圖2中的變量又變成了樣本的均值。
舉例:假如現在要調查某個學校學生的政治成績,要計算學生政治的平均成績。要是去收集每個學生的成績,然後加總,再除以學生總數,整個工作力度很大,成本也高。這時候中心極限定理就派上用場了,可以先從校園中随機的抽取50個人,然後計算這50個人的平均成績,每個學生記為Xi,計算平均成績;然後再随機的抽取的50個人,再計算平均成績;一直這樣随機的抽取,到最後進行了m次,一共得到m個平均成績,中心極限定理說的就是這m個平均成績的分布是正态分布,它們的均值就是該校學生政治的平均成績。這裡假設每個學生的成績服從【0-100】間的均勻分布。
圖3 m個不同平均成績的概率分布
中心極限定理還有一點要注意,就是不管Xi 服從的是何種分布,隻要它們相互獨立且分布相同,隻要樣本量足夠大,其均值最終都會服從正态分布。
再比如:從指數分布中提取樣本
圖4
從圖4的指數函數曲線上每次随機抽取200個數據點,計算樣本的均值,并将其繪制在直方圖上。計算1000個這樣的樣本的均值,并将其畫在直方圖上,樣本均值還是正态分布。所以,
中心極限定理意味着即使數據分布不是正态的,從中抽取的樣本均值的分布也是正态的。
那麼,中心極限定理如何證明呢?
首先要用到特征函數:
中心極限定理的證明:
圖5
上面的變化用到了下面兩個推導:
則圖5中
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!