當一個事件的發生滿足以下條件時,可以認為這個事件在某一固定時間段内的發生次數滿足柏松分布。
總結起來就是,事件的發生是随機且獨立的。
泊松分布的概率質量函數:
x表示一段時間内事件發生的次數,λ表示一段時間内事件發生的平均次數。
舉個例子:
假設某媒體平台一天的用戶廣告轉化數平均為1次,每天的廣告轉化數就滿足泊松分布。
那麼根據泊松分布,我們想知道該媒體平台每周廣告轉化數為10次的概率,應該怎麼算?
首先,固定時間由一天增加到一周,一周的平均點擊則為7次,泊松分布的λ為7,要求轉化數為10次的概率,泊松分布的概率質量函數的輸入x為10,代入公式可以求出:
可以得出該媒體每周廣告的轉化數為10次的概率為0.070983。
根據上例,将時間考慮進泊松分布的概率質量函數,可以得到:
x表示單位時間内事件發生的次數,λ表示單位時間内事件發生的平均次數,t表示t個單位時間,N(t)表示關于時間的某種函數。
泊松分布與二項分布的關系回顧二項分布的概率質量函數:
我們依然拿上面舉的例子來探索泊松分布與二項分布的關系。
假設某媒體平台一天的用戶廣告轉化數平均為1次,一天廣告點擊的次數平均為1000次,那麼廣告的點擊轉化率為0.1%,我們現在根據二項分布來計算,該媒體平台每周廣告轉化數為10次的概率。
首先,時間範圍是一周,那麼一周的廣告的平均點擊數為7000次,廣告的點擊轉化率依然是0.1%不會随時間變化而改變,那麼将n為7000,x為10,p為0.1%代入二項分布的概率質量函數求出:
可以看出該媒體每周廣告的轉化數為10次的概率為0.070988。對比上面利用泊松分布的公式計算的值,發現二者值非常的接近,這是一種巧合還是一種必然?下面我們從二項分布的概率質量函數着手,由于二項分布中λ=np,将p=λ/n代入看看能有什麼發現。
當n趨近于正無窮時,
驚奇的發現當n趨于正無窮時,二項分布的概率質量函數和泊松分布的概率質量函數相同。看來在例子中的結果非常接近不是巧合。所以我們可以利用泊松分布來估算二項分布。這樣做的原因主要有兩個:
指數分布針對兩個事件發生的時間間隔,與泊松分布不同,泊松分布是離散型分布,指數分布是連續型分布。如果單位時間内事件的發生次數滿足泊松分布,那麼事件發生的時間間隔滿足指數分布。指數分布的概率密度函數是:
概率分布函數則為:
λ表示單位時間内事件發生的平均次數,t表示t個單位時間。
可以從泊松分布來理解指數分布。對于泊松分布,t時間内事件發生次數為0的概率為:
t時間内事件發生次數為0的另外一種理解可以是,事件第一次發生的時間T要大于t。
即
那麼事件在t時間内發生的概率為:
與指數分布的概率分布函數保持一緻。
同一個例子,假設某媒體平台一天的用戶廣告轉化數平均為1次,我們想知道該媒體平台在第2天到5天内完成一次轉化的概率,就可以根據指數分布來計算。
首先,一天内的平均轉化數為1,則λ為1。要在第2天與第5天之間完成一次轉化,利用P(T<= 5) - P(T<= 2)來計算概率,得:
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!