指數分布公式:=EXPONDIST(x,平均值,FALSE)
提到這個分布往往就必須聯系泊松分布,這兩者之間關系還挺大的
泊松分布公式:=POISSON(X,平均值,FALSE)
公式裡的參數看起來是不是好像的說?但實際上,它們是有一點區别的
之前解釋二項分布時,參數中的第一項X,通常都被解釋成一件事情發生的次數,也就說它一般是個整數,而到了泊松分布時,雖然X的取值不再有總實驗次數N的上限,但為了方便和二項分布比較,這裡的X我依然還是解釋成了事情發生的次數
但是就更一般的情況來說,其實它還可以解釋為時間,為什麼呢?因為時間這個概念,其實是個人為創造的刻度,你可以使用通常意義上的一分鐘、一小時乃至一天作為時間的單位,但也可以用一件以固定頻率不斷重複發生的事情每出現一次(或一個周期)作為一個時間間隔,這樣的話,泊松分布便成為了一種适用于推廣到時間序列的計算方式
所以此處泊松分布裡的參數"平均值",其實也可以解釋為,在一個單位周期裡,某件事情的平均發生次數
那指數分布和泊松分布有什麼聯系呢?首先就概念上來說,它們公式參數中的"平均值",指的其實是同一個意思,都是單位周期裡事情的發生次數,而主要的區别,是參數X的取值
可以做個小小的實驗,比如取同樣的平均值5,并計算一系列的X,可以看到兩種分布的計算結果:
表格有點長,可以直接看圖:
是不是覺得泊松分布那條線有點奇怪?
細心點的親有可能注意到了,泊松分布的計算結果隻有整數的X值,當X取小數時自動向下取整,以緻于這條線變成了一截一截的,但指數分布的X是不受帶小數點的影響的,因為它的主要功能是計算距離事情下次發生的周期時長
套用之前看的網劇天才J中某集的概念(第一季,具體哪集忘記了),我個人是這麼理解的,泊松分布表示是是一件事情的通用規律,是整個事情的整數部分,而指數分布則表示這件事情的偶然性,相當于這件事情的小數部分,但這兩個公式的本質是一樣的,而且它們的确都屬于同一個族,這個族名叫伽馬分布
對上面這個觀點有疑惑的可以查下它們的數學公式形式,不過我本人作為應用型(俗稱數學沒學好),一向碰到數學推導就跳過,所以在這裡僅用我自己的習慣來證明觀點:
上面的數據用Excel算一下還是很容易驗證的
最後提一個在很多講指數分布的資料上都會重點強調的地方,這個分布有個重要的特征叫做無記憶性,關于這個特征的解釋,我在某個論壇的帖子裡看到了一個很牛的例子,自認不會比他解釋的好,所以直接上圖了:
這個例子很準确的說明了一個問題,那就是我們提到的從二項分布到泊松分布再到今天的指數分布,其實都是具備同一個條件,那就是獨立随機,什麼意思呢?就是說不管是扔硬币猜拳還是擲骰子,當整個環境規則(先驗概率)确定後,事情的結果是不确定的,而且每一次事件的發生都與之前已經發生的事情沒有聯系,我們費那麼多事算出來的東西,終究是對未知世界的一種猜測罷了
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!