前一篇文章寫的是離散型随機變量的概率分布,今天我們來聊聊連續型随機變量的概率分布。
并非所有的數據都是連續的,根據數據類型的不同,有不同的求概率的方法,對于離散型随機變量的概率分布,我們關心的是取某一個特定數值下的概率,而對于連續型随機變量的概率分布,我們關心的是取某一個特定範圍内的概率。
首先要提到的一個概念就是:
概率密度函數
概率密度函數用來描述連續型随機變量的概率分布,用函數f(x)表示連續型随機變量,将f(x)就稱為概率密度函數,概率密度并非概率,隻是一種表示概率的方法,大家不要混淆,其曲線下面的面積表示概率。
概率密度函數下方的總面積為1,因為面積代表概率,而概率是必須為1。
下面是三種典型的連續型随機變量的概率分布
1. 正态分布随機變量X服從一個數學期望為μ、方差為σ^2的正态分布,就是正态分布,也叫做高斯分布,通常記做:
标準正态分布
正态分布是一個鐘形曲線,曲線對稱,中央部分的概率密度最大,越往兩邊,概率密度越小。μ決定了曲線的中央位置,σ決定了曲線的分散性,σ越大,曲線越平緩,σ越小,曲線越陡峭。
如何求正态分布的概率?
正态分布的概率密度函數滿足:
連續型随機變量的理想模型就是正态分布,求正态分布的概率同樣是求概率密度曲線下的面積,曲線的面積如何求?沒關系,已經有前人栽樹了,總結好了一整套的概率對應表,我們就直接乘涼就好了,其實求正态分布下的概率,是高中數學的知識點,但是如今我們完全可以借助Excel、Python這些工具也是可以直接計算出來,就沒必要學習怎麼去手算了。
标準正态分布的意義是,任何一個正态分布都可以通過線性變換轉換為标準正态分布。
正态分布
很多實際問題都是符合正态分布的,如身高、體重等。正态分布在質量管理中也應用的非常廣泛,“3σ原則”就是在正态分布的原理上建立的。3σ原則是:
可以用Python裡的matplotlib來畫一下正态分布
scipy.stats 是 scipy 專門用于統計的函數庫,所有的統計函數都位于子包 scipy.stats 中
fig,ax=plt.subplots(1,1)
loc=1
scale=2.0
#平均值,方差,偏度,峰度
mean,var,skew,kurt=norm.stats(loc,scale,moments='mvsk')
#printmean,var,skew,kurt
#ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X<x)=0.01時的x值。
x=np.linspace(norm.ppf(0.01,loc,scale),norm.ppf(0.99,loc,scale),100)
ax.plot(x,norm.pdf(x,loc,scale),'b-',label='norm')
plt.title(u'正态分布概率密度函數')
plt.show()
結果:
2. 均勻分布
均勻分布,也叫矩形分布,是概率密度函數在結果區間内為固定數值的分布
均勻分布
它的概率密度函數為:
均勻分布在自然情況下極為罕見,同樣來畫一下均勻分布
#均勻分布
fig,ax=plt.subplots(1,1)
loc=1
scale=1
#平均值,方差,偏度,峰度
mean,var,skew,kurt=uniform.stats(loc,scale,moments='mvsk')
#ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X<x)=0.01時的x值。
x=np.linspace(uniform.ppf(0.01,loc,scale),uniform.ppf(0.99,loc,scale),100)
ax.plot(x,uniform.pdf(x,loc,scale),'b-',label='uniform')
plt.title(u'均勻分布概率密度函數')
plt.show()
結果:
3. 指數分布
指數分布是描述泊松過程中的事件之間的時間的概率分布,即事件以恒定平均速率連續且獨立地發生的過程。如旅客進機場的時間間隔,還有許多電子産品的壽命分布一般服從指數分布。
指數分布
其概率密度函數為:
指數分布具有無記憶的關鍵性質。這表示如果一個随機變量呈指數分布,當s,t>0時有P(T>t s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。用Python畫指數分布的概率密度函數
fig,ax=plt.subplots(1,1)
lambdaUse=2
loc=0
scale=1.0/lambdaUse
#平均值,方差,偏度,峰度
mean,var,skew,kurt=expon.stats(loc,scale,moments='mvsk')
#ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X<x)=0.01時的x值。
x=np.linspace(expon.ppf(0.01,loc,scale),expon.ppf(0.99,loc,scale),100)
ax.plot(x,expon.pdf(x,loc,scale),'b-',label='expon')
plt.title(u'指數分布概率密度函數')
plt.show()
結果:
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!