tft每日頭條

 > 生活

 > 統計模型正态分布

統計模型正态分布

生活 更新时间:2025-01-08 14:10:56

分布以數學的方式刻畫變量的變差(在某個類型内部的差異)和多樣性(不同類型之間的差異),将變量表示為在數值上或類别上定義的概率分布。正态分布的形狀是我們熟悉的鐘形曲線形狀。大多數物種的高度和重量都滿足正态分布,它們圍繞着均值對稱分布,而且不會包含特别大或特别小的事件。

中心極限定理告訴我們,隻要把随機變量加總或求其平均值,就可以期望獲得正态分布。許多經驗現象,特别是像銷售數據或投票總數這樣的總量數據,都可以寫成随機事件總和的形式。正态分布意味着不會有太大的偏差。

一、正态分布分布為事件或價值分配概率。各種統計量将分布中包含的信息壓縮為單個數值,例如均值,分布的平均值。均值之外的第二個重要統計量是方差,可以衡量一個分布的離散程度,也就是數據與均值之間距離的平方的平均值。分布的标準差是另一個常用的統計量,等于方差的平方根。

統計模型正态分布(模型思維之正态分布)1

二、中心極限定理隻要各随機變量是相互獨立的,每個随機變量的方差都是有限的,且沒有任何一小部分随機變量貢獻了大部分變差,那N≥20個随機變量的和就近似一個正态分布。中心極限定理一個非常重要的特征是,随機變量本身不一定是正态分布的。它們可以有任何分布,隻要每一個随機變量都具有有限的方差,并且它們中的任何一小部分随機變量都不貢獻大部分方差。

三、運用1、平方根法則(The square root rules)N個相互獨立的随機變量,都具有标準差σ,對這些随機變量的均值的标準差σμ和對這些随機變量總和的标準差σΣ,分别由以下公式給出:

統計模型正态分布(模型思維之正态分布)2

均值的标準差公式表明,大的總體的标準差要比小的總體的标準差低得多。由此可以推斷,在小的群體中應該會觀察到更多的好事和更多的壞事。2、檢驗顯著性可以利用正态分布的規律來檢驗各種平均值的顯著性差異。如果經驗均值與假設均值之間的偏差了超過兩個标準差,那麼社會科學家就會拒絕這兩種均值相同的假設。3、六西格瑪方法六西格瑪方法是摩托羅拉公司于20世紀80年代中期提出的,目的是減少誤差,該方法根據正态分布對産品屬性進行建模。六西格瑪方法涉及縮減标準差的大小從而降低生産出不合格産品的可能性。各企業可以通過加強質量控制來降低誤差率。

四、對數正态分布:乘法沖擊中心極限定理要求我們對随機變量求和或求平均值,以獲得正态分布。如果随機變量是不可相加而是以某種方式相互作用的,或者如果它們不是相互獨立的,那麼産生的分布就不一定是正态分布。事實上,一般情況下都不會是。獨立随機變量之間的乘積就不是正态分布,而是對數正态分布。百分比加薪方法與絕對金額加薪方法兩者之間的區别乍一看似乎隻是語義上的區别,但其實不然。如果每一年的績效都是相互獨立且随機的,那麼根據員工績效按百分比加薪,就會産生一個對數正态分布。即使後來的表現相同,未來幾年的收入差距也會加劇。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved