這是《機器學習中的數學基礎》系列的第20篇,也是概率與統計的第4篇。
一說起期望值,可能有的人會很陌生;但一說起平均數,可能大部分人都了解。其實求期望和求平均之間還是有那麼一些關系的。
我們先來舉個例子,讓你對期望有直觀的理解。
假設我有1個不均勻的六面體,每個面标了一個數字,分别是1、2、3、4、5、6。如果我将此六面體向上抛出,那麼落地時向上一面的概率如下表所示:
顯然,上述的概率之和為1。那麼此六面體向上一面的期望是什麼呢?
我們是這樣計算期望的:把每個面出現的概率乘以每個面的數字,然後算它們的加和。即:
1·1/6 2·1/3 3·1/6 4·1/12 5·1/12 6·1/6=37/12
因此,上面這個六面體落地時正面朝上的期望就是37/12,換算成整數約等于3.
不均勻的算出來了,那如果是均勻的六面體呢?它落地時向上的一面的期望又是什麼呢?
很簡單,由于是均勻的六面體,那麼每個面朝上的概率都是1/6。因此,總的期望就是1/6(1 2 3 4 5 6)=21/6=3.5。此時,就相當于我們求了1-6的平均數。
換句話說,如果每個數字出現的概率是相等的,那我們就相當于求的平均數;如果每個數字出現的概率是不等的,那我們就在求期望。我們一般用“E”來表示期望。
我們還是來舉例說明什麼是方差。
假設小明期末考試考了6門課,他的成績分别是60,78,77,90,92,83。那麼小明成績的方差該怎麼算呢?
我們需要先算出小明的平均成績:(60 78 77 90 92 83)/6=80。
然後,分别用小明每一門課的成績減去平均成績,求出差的平方,再算出這些平方的平均值。即
[(60-80)^2 (78-80)^2 (77-80)^2 (90-80)^2 (92-80)^2 (83-80)^2]/6=111。
我們把這個結果就叫做方差。把它一般化, 假設有x1、x2...xn一共n個數據,它們的均值是μ,那麼方差就可以表示為:
有時候分母的n也會換成n-1,取決于它是樣本數據還是整體數據,不過對我們的結果影響不大。
那麼方差有什麼意義呢?它所表示的是數據的波動程度,更具體的說,它表示的是數據與均值之間的離散程度。方差越大,表明數據越分散,離均值的平均距離遠;方差越小,表明數據大多集中在均值周圍。
标準差就是方差開方得到的結果,即
那這麼做有什麼意義呢?注意到,我們的方差是求了平方的,如果我們的數據是有單位的話,最後的結果将是單位的平方,對這個結果不是很好解釋。比如上面小明成績的方差是111,單位是“分”的平方。我們就會感到很奇怪。
将方差開方後,單位就變成了原來的單位,那麼結果就很好解釋了。可以得出,小明成績的标準差約為10.5分。也就是說,小明的成績與均值的差距平均在10.5分。
标準差同樣衡量數據的波動狀況,隻不過它的結果很好解釋。
好了,這就是今天的全部内容,歡迎留言讨論。
本文由人人都會機器學習原創,歡迎關注,帶你一起長知識!
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!