前面講到的二項分布、超幾何分布和泊松分布所涉及的都是離散數據,即數據由一個個單獨的數值組成,其中的每一個數值都有相應的概率,離散數據往往能以某種方式進行計數,能取确切值,所以離散數據也被稱為數值型數據。
然而,并非所有的數值型數據都是離散的。有時候,一一列舉一個數據集中的所有數值并不總是能夠實現。有時候,數據涵蓋的是一個範圍,這個範圍内的任何一個數值都有可能成為事件結果。例如,假如讓你稱重幾個蘋果的重量,并且已知這些蘋果的重量在500g到800g之間,稱重結果可能是500.1g、500.56g、600.36g等等。類似重量、長度這樣的數據叫做連續數據,連續數據往往通過測量得到,而不是通過計數得到。
對于離散概率分布來說,我們關心的是取得一個特定數值的概率;而對于連續概率分布來說,我們關心的是取得一個特定範圍的概率,而概率密度函數就是用于描述連續随機變量的概率分布的。
概率密度函數概率密度函數f(x)是這樣一種函數:通過它可以求出一個數據範圍内的某個連續變量的概率,它向我們指出該概率分布的形狀。
1、欲算概率,先求f(x)
f(x) * 20 = 1, => f(x) = 0.05(概率密度函數)
2、再求面積,可得概率
假設我們要求出P(x>5),如下圖
P(x>5)= (20-5)* f(x)=15 * 0.05 = 0.75
所以,處理連續數據時,所計算的是一個數值範圍内的概率,在圖形中表現為面積。
理解概率密度函數是計算連續型概率分布的基礎,下一節将詳細剖解正态分布。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!