tft每日頭條

 > 圖文

 > python正态分布求陰影面積

python正态分布求陰影面積

圖文 更新时间:2025-01-06 20:39:31

  現代統計學奠基人之一、英國統計學家費希爾(Fisher)曾把抽樣分布、參書估計和假設檢驗看作統計推斷的三大中心内容。

  統計學中,需要研究統計量的性質,并評價一個統計推斷的優良性,而這些取決于其抽樣分布的性質,所以,抽樣分布是統計學中的重要内容。

  統計學中常見的抽樣分布有4種:正态分布、卡方分布、t分布、F分布,後面三大分布都是在正态分布的基礎上推導出來的。

  正态分布 正态分布是最重要的一種分布,其分布曲線呈鐘型,兩頭低,中間高,左右對稱因其曲線呈鐘形。

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(1)

  自然界中很多現象都是符合正态分布,比如:

  人的身高,特别高和特别矮的人都是少數,中等身材的占大多數。一個班的成績,特别低和特别高的都是少數,處于中間狀态的占大多數。 正态分布的概率密度函數為:

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(2)

  其中,μ為均值,σ為标準差。

  當μ=0,σ=1時,相應的正态分布N(0,1)稱為标準正态分布

  通過Python可以很容易地繪制出标準正态分布的分布曲線圖。

  from pylab import mpl mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默認字體 mpl.rcParams['axes.unicode_minus'] = False # 解決保存圖像是負号'-'顯示為方塊的問題 import numpy as np from scipy import stats import matplotlib.pyplot as plt mu=0 sigma=1 x=np.arange(-5,5,0.1) y=stats.norm.pdf(x,0,1) plt.plot(x,y) plt.title("正态分布曲線:$\mu$=%.1f,$\sigma^2$=%.1f" % (mu,sigma)) plt.ylabel("概率密度",fontsize=14) plt.show()

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(3)

  卡方分布 卡方分布由阿貝(Abbe)于1863年首先提出的,并由Hermert(赫爾默特)和Pearson(皮爾遜)分别于1875年和1900年推導出來。

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(4)

  設置自由度為5,通過Python繪制出卡方分布的分布曲線圖。

  from scipy.stats import chi2 # 卡方分布 df = 5 # 自由度 x = np.linspace(chi2.ppf(0.01, df), # 繪制概率密度圖 chi2.ppf(0.99, df), 100) plt.plot(x, chi2.pdf(x, df), alpha=0.6, label='chi2 pdf') plt.title(u'自由度為5時的卡方分布曲線圖',fontsize=12) plt.show()

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(5)

  增大自由度到20,通過Python繪制出卡方分布的分布曲線圖。

  from scipy.stats import chi2 # 卡方分布 df = 100 # 自由度 x = np.linspace(chi2.ppf(0.01, df), # 繪制概率密度圖 chi2.ppf(0.99, df), 100) plt.plot(x, chi2.pdf(x, df), alpha=0.6, label='chi2 pdf') plt.title(u'自由度為20時的卡方分布曲線圖',fontsize=12) plt.show()

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(6)

  從上面可以看出,當自由度不斷增大時,卡方分布趨于正态分布。

  t分布 t分布也稱學生氏分布,由Gosset(戈賽特)于1908年以Student(學生)為筆名發表的論文中首次提出。

  說明:據說當時他還在都柏林的健力士釀酒廠工作,不能以他本人的名義發表。

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(7)

  設置自由度為5,通過Python繪制出t分布的分布曲線圖。

  from scipy.stats import t df = 5 x = np.linspace(t.ppf(0.01, df), t.ppf(0.99, df), 100) plt.plot(x, t.pdf(x, df), alpha=0.6,label="t分布") plt.title('自由度為5時的t分布曲線圖', fontsize=12) mu=0 sigma=1 x=np.arange(-5,5,0.1) y=stats.norm.pdf(x,0,1) plt.plot(x,y,label="正态分布") plt.legend(loc="best") plt.show()

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(8)

  增大自由度到15,通過Python繪制出t分布的分布曲線圖。

  from scipy.stats import t df = 15 x = np.linspace(t.ppf(0.01, df), t.ppf(0.99, df), 100) plt.plot(x, t.pdf(x, df), alpha=0.6,label="t分布") plt.title('自由度為15時的t分布曲線圖', fontsize=12) mu=0 sigma=1 x=np.arange(-5,5,0.1) y=stats.norm.pdf(x,0,1) plt.plot(x,y,label="正态分布") plt.legend(loc="best") plt.show()

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(9)

  從上面可以看出,當自由度不斷增大時,t分布趨于正态分布。

  F分布 F分布由統計學家費希爾(Fisher)首先提出,并以其姓氏的第一個字母命名的,所以叫F分布。

  F分布在方差分析、回歸分析的顯著性檢驗中有着重要的應用。

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(10)

  可以看到,F分布有兩個自由度,分别為第一自由度和第二自由度,而且它們的位置不可互換。

  設置第一自由度為10,第二自由度為10,通過Python繪制出F分布的分布曲線圖。

  from scipy.stats import f df1=10 df2=10 x = np.linspace(f.ppf(0.01,df1,df2), f.ppf(0.99,df1,df2), 1000) plt.plot(x, f.pdf(x,df1,df2), alpha=0.6) plt.title('第一自由度為10,第二自由度為10的F分布曲線圖', fontsize=12) plt.show()

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(11)

  增大自由度,第一自由度為100,第二自由度為100,通過Python繪制出F分布的概率密度曲線圖。

  from scipy.stats import f df1=100 df2=100 x = np.linspace(f.ppf(0.01,df1,df2), f.ppf(0.99,df1,df2), 1000) plt.plot(x, f.pdf(x,df1,df2), alpha=0.6) plt.title('第一自由度為100,第二自由度為100的F分布曲線圖', fontsize=12) plt.show()

  python正态分布求陰影面積(統計學中常見的4種抽樣分布及其分布曲線)(12)

  從上面可以看出,自由度會影響F分布的形态。

  總結 正态分布是核心,其他三大分布:卡方分布、t分布、F分布均由正态分布導出。

  關于抽樣分布,你有什麼看法呢?歡迎在評論區留言!

  ,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关圖文资讯推荐

热门圖文资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved