想想明天要過國慶節了,好好的節假日怎麼能不偷懶呢?所以,放水的内容得留着明天寫,今天還是弄點正經的吧
泊松分布,在很多介紹的文章裡都會把它和二項分布放在一起比較,因為它們有點像,對于這個觀點,我是不會腦抽到為了标新立異而去刻意反對的
先放出Excel中的公式:
=POISSON(X,平均數,FALSE)
其中X的定義和二項分布中一樣,是一件事情發生的次數,要求是個大于等于0的整數(你放個帶小數點的數字進去它也不會報錯,就是自動給你向下取整罷了),不同的地方是X的取值沒有設上線(二項分布中要求X的大小需要小于總的實驗次數N)
既然不能不提到二項分布,那幹脆列出來再比較下:
=BINOMDIST(X,N,P, FALSE)
有沒有發現參數的個數不一樣?嗯,泊松分布要求的輸入比二項分布少一點,但是就意義上來說差别卻不是很大,為什麼這麼說呢?
泊松分布中的參數"平均值"一定程度上相當于二項分布的總實驗次數N*先驗概率P
咱還是舉猜拳這個例子(沒錯,人家和硬币杠上,我是和猜拳杠上了)
二項分布中,比方咱們假設和一個不認識的家夥猜了30次拳(夠無聊的啊),咱赢的先驗概率是1/3,放到二項分布那就是=BINOMDIST(X,30,1/3, FALSE)
但要是放到泊松分布,它的理解方式大概是這樣的,我們比方說是在10分鐘裡和對方猜完了30次拳,正常來說平均的赢面1/3也就是平均值30/3=赢10次,那麼咱們在下個10分鐘裡和對方再猜30次拳,請估計下比較可能赢多少次呢?
公式就變成了這樣:=POISSON(X,10,FALSE)
我們把X從0到31都代進去看看:
首先可以看到右下角二項分布的最後一個數,由于X=31超出了總次數30,所以直接報錯,而泊松分布雖然沒有次數限制,但是當X取值大于平均值很多很多的時候,它計算出的概率已然是0了,即使不報錯,再計算下去也不會有意義
所謂字不如表,表不如圖,咱看下用這些計算結果畫出來的圖:
雖然有點差距,但整個圖形還是有點像的
根據有些介紹文章上的推論,當二項分布取的實驗次數足夠大的時候,和泊松分布近似相等,人家數學能力高端,可以像模像樣用公式推導求極限什麼的來證明,我就比較粗糙了,實踐出真知,不就是把數值放大麼,做一個呗
咱現在在這個例子上放大100倍,這樣的話,公式就變成了:
二項分布=BINOMDIST(X,3000,1/3, FALSE)
泊松分布=POISSON(X,1000,FALSE)
結果就不列表了,直接上圖:
(前後端的0值略有點多啊,我就截當中一段吧)
感覺曲線最高點的位置好像是近了一丢丢,但是高度上還是有點差别
聽說先驗概率P越小,這兩貨也會越接近,那我再捯饬下看看?
概率P縮小到1/10時
二項分布=BINOMDIST(X,3000,1/10, FALSE)
泊松分布=POISSON(X,300,FALSE)
嗯,感覺那些推導公式的家夥應該沒有蒙人,看着是接近點了呢~~~~
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!