均值描述的是樣本集合的中間點,它告訴我們的信息是有限的。
方差(variance)是在概率論和統計方差衡量随機變量或一組數據時離散程度的度量。概率論中方差用來度量随機變量和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是各個數據分别與其平均數之差的平方的和的平均數。在許多實際問題中,研究方差即偏離程度有着重要意義。方差是衡量源數據和期望值相差的度量值。
而标準差給我們描述的是樣本集合的各個樣本點到均值的距離之平均。
以這兩個集合為例,[0,8,12,20]和[8,9,11,12],兩個集合的均值都是10,但顯然兩個集合的差别是很大的,計算兩者的标準差,前者是8.3後者是1.8,顯然後者較為集中,故其标準差小一些,标準差描述的就是這種“散布度”。之所以除以n-1而不是n,是因為這樣能使我們以較小的樣本集更好地逼近總體的标準差,即統計上所謂的“無偏估計”。而方差則僅僅是标準差的平方。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!