tft每日頭條

 > 生活

 > 正态分布分析結果解讀

正态分布分析結果解讀

生活 更新时间:2025-01-09 05:53:11

前一篇文章寫的是離散型随機變量的概率分布,今天我們來聊聊連續型随機變量的概率分布。

并非所有的數據都是連續的,根據數據類型的不同,有不同的求概率的方法,對于離散型随機變量的概率分布,我們關心的是取某一個特定數值下的概率,而對于連續型随機變量的概率分布,我們關心的是取某一個特定範圍内的概率

首先要提到的一個概念就是:

概率密度函數

概率密度函數用來描述連續型随機變量的概率分布,用函數f(x)表示連續型随機變量,将f(x)就稱為概率密度函數,概率密度并非概率,隻是一種表示概率的方法,大家不要混淆,其曲線下面的面積表示概率。

概率密度函數下方的總面積為1,因為面積代表概率,而概率是必須為1。

正态分布分析結果解讀(終于搞清楚正态分布)1

下面是三種典型的連續型随機變量的概率分布

1. 正态分布

随機變量X服從一個數學期望為μ、方差為σ^2的正态分布,就是正态分布,也叫做高斯分布,通常記做:

正态分布分析結果解讀(終于搞清楚正态分布)2

标準正态分布

正态分布是一個鐘形曲線,曲線對稱,中央部分的概率密度最大,越往兩邊,概率密度越小。μ決定了曲線的中央位置,σ決定了曲線的分散性,σ越大,曲線越平緩,σ越小,曲線越陡峭。

正态分布分析結果解讀(終于搞清楚正态分布)3

如何求正态分布的概率?

正态分布的概率密度函數滿足:

正态分布分析結果解讀(終于搞清楚正态分布)4

連續型随機變量的理想模型就是正态分布,求正态分布的概率同樣是求概率密度曲線下的面積,曲線的面積如何求?沒關系,已經有前人栽樹了,總結好了一整套的概率對應表,我們就直接乘涼就好了,其實求正态分布下的概率,是高中數學的知識點,但是如今我們完全可以借助Excel、Python這些工具也是可以直接計算出來,就沒必要學習怎麼去手算了。

标準正态分布的意義是,任何一個正态分布都可以通過線性變換轉換為标準正态分布。

正态分布分析結果解讀(終于搞清楚正态分布)5

正态分布

很多實際問題都是符合正态分布的,如身高、體重等。正态分布在質量管理中也應用的非常廣泛,“3σ原則”就是在正态分布的原理上建立的。3σ原則是:

  • 數值分布在(μ—σ,μ σ)中的概率為0.6826
  • 數值分布在(μ—2σ,μ 2σ)中的概率為0.9544
  • 數值分布在(μ—3σ,μ 3σ)中的概率為0.9974 因此可以認為,Y 的取值幾乎全部集中在(μ—3σ,μ 3σ)]區間内,超出這個範圍的可能性僅占不到0.3%,這是一個小概率事件,通常在一次試驗中是不會發生的,一旦發生就可以認為質量出現了異常。

正态分布分析結果解讀(終于搞清楚正态分布)6

可以用Python裡的matplotlib來畫一下正态分布

scipy.stats 是 scipy 專門用于統計的函數庫,所有的統計函數都位于子包 scipy.stats 中

fig,ax=plt.subplots(1,1) loc=1 scale=2.0 #平均值,方差,偏度,峰度 mean,var,skew,kurt=norm.stats(loc,scale,moments='mvsk') #printmean,var,skew,kurt #ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X<x)=0.01時的x值。 x=np.linspace(norm.ppf(0.01,loc,scale),norm.ppf(0.99,loc,scale),100) ax.plot(x,norm.pdf(x,loc,scale),'b-',label='norm') plt.title(u'正态分布概率密度函數') plt.show()

結果:

正态分布分析結果解讀(終于搞清楚正态分布)7

2. 均勻分布

均勻分布,也叫矩形分布,是概率密度函數在結果區間内為固定數值的分布

正态分布分析結果解讀(終于搞清楚正态分布)8

均勻分布

它的概率密度函數為:

正态分布分析結果解讀(終于搞清楚正态分布)9

均勻分布在自然情況下極為罕見,同樣來畫一下均勻分布

#均勻分布 fig,ax=plt.subplots(1,1) loc=1 scale=1 #平均值,方差,偏度,峰度 mean,var,skew,kurt=uniform.stats(loc,scale,moments='mvsk') #ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X<x)=0.01時的x值。 x=np.linspace(uniform.ppf(0.01,loc,scale),uniform.ppf(0.99,loc,scale),100) ax.plot(x,uniform.pdf(x,loc,scale),'b-',label='uniform') plt.title(u'均勻分布概率密度函數') plt.show()

結果:

正态分布分析結果解讀(終于搞清楚正态分布)10

3. 指數分布

指數分布是描述泊松過程中的事件之間的時間的概率分布,即事件以恒定平均速率連續且獨立地發生的過程。如旅客進機場的時間間隔,還有許多電子産品的壽命分布一般服從指數分布。

正态分布分析結果解讀(終于搞清楚正态分布)11

指數分布

其概率密度函數為:

正态分布分析結果解讀(終于搞清楚正态分布)12

指數分布具有無記憶的關鍵性質。這表示如果一個随機變量呈指數分布,當s,t>0時有P(T>t s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。用Python畫指數分布的概率密度函數

fig,ax=plt.subplots(1,1) lambdaUse=2 loc=0 scale=1.0/lambdaUse #平均值,方差,偏度,峰度 mean,var,skew,kurt=expon.stats(loc,scale,moments='mvsk') #ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X<x)=0.01時的x值。 x=np.linspace(expon.ppf(0.01,loc,scale),expon.ppf(0.99,loc,scale),100) ax.plot(x,expon.pdf(x,loc,scale),'b-',label='expon') plt.title(u'指數分布概率密度函數') plt.show()

結果:

正态分布分析結果解讀(終于搞清楚正态分布)13

正态分布分析結果解讀(終于搞清楚正态分布)14

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved