标準偏差計算中的樣本量補償
本文讨論了貝塞爾校正,這有助于我們更準确地估計某些參數和長時信号的标準偏差。
本文是我們針對電氣工程師的統計數據系列的延續,其中第一個介紹了統計數據,作為分析電路行為和表征工程系統的方法。然後,我們讨論了特定的方法-尤其是使用平均值和中位數來找到數據集的集中趨勢。最近,我們介紹了三種統計性描述量度-平均偏差,标準偏差和信号處理中的方差,以了解與這些中心趨勢的偏離。以我們上一篇有關标準差的文章為背景,我們現在可以讨論該讨論的另一個關鍵方面:标準差計算中的樣本量補償。
除以N還是N–1?
如果您已閱讀上一篇文章,也許您會注意到在計算離散數據的标準偏差時所使用的公式中的明顯差異。公式如下:
标準偏差表示信号随機偏差的平均功率。但是,當我們計算某物的平均值(即算術平均值)時,我們總是除以N(其中N表示數據點的數量),而不是除以N-1。
為什麼在計算标準偏差時使用N-1?
實際上,我們并不總是除以N-1。我們可以使用N而不是N–1來計算标準差,但是從理論上講,所得的數字表示不同的東西。我強調“理論上”,因為在電氣工程的情況下,差異通常很小。盡管如此,重要的是要了解基本概念,該概念植根于樣本與總體之間的差異。
樣本,總體和标準偏差
假設購買了一個運算放大器(零件編号為OPA100),并在實驗室進行了一些實驗後,您意識到數據表中的規格不能為您提供有關應用工作溫度下輸入失調電壓的足夠信息。為了解決這個問題,您決定購買15個OPA100運算放大器(因此N = 15),進行一些測量,并根據該樣本生成一些統計數據。
如果OPA100在相關工作溫度下的典型失調電壓為1 mV,則15個分量樣本中的失調電壓分布可能如下所示:
随着樣本數量的增加,測得的分布将更接近正态分布。
您已經測量了每個組件的偏移電壓,現在可以計算标準偏差,但是首先,您需要問自己一個問題:我要計算樣本還是總體的标準偏差?換句話說,我應該在我面前報告這15個組件的标準偏差,還是應該嘗試報告适用于所有OPA100運算放大器的标準偏差?
樣品的标準偏差
如果我們正在處理一個樣本,并且想知道該樣本的标準偏差,則除以N。這是有道理的-如上所述,在計算算術平均值時,我們總是除以N,并且标準偏差涉及數據集中偏差乘方的算術平均值。
因此,繼續我們的示例,除以N會告訴您所購買的15個OPA100運算放大器的标準偏差。
垂直線表示電壓值,該電壓值是樣本平均值上下的一個标準偏差。在計算标準偏差時,我用N除以。
電氣工程師經常遇到的另一種數據集是數字化電壓信号,正如我們在前一篇文章中所看到的,标準偏差是一種量化電氣噪聲的方法。
如果您想知道所采集信号的标準偏差,即被數字化并存儲在内存中的特定電壓電平,則在計算标準偏差時将除以N。在這種情況下,所獲取的信号是統計樣本。
總體标準差
如果我們正在處理樣本,并且想知道總體的标準差,則可以除以N–1。“總體”是指所獲得的數據點為其提供代表性樣本的整個群體。使用N-1而不是N是一種補償與有限樣本量相關的誤差的方法。該技術稱為貝塞爾校正。
需要進行校正是因為如果要計算總體的标準偏差,則應使用總體平均值。但是我們通常無法獲得總體均值。我們隻有樣本均值,它是總體均值的近似值。事實證明,當我們使用樣本平均值而不是總體平均值時,标準偏差始終較低,并且用N-1(而不是N)除以減輕這種影響。
因此,如果要估算所有已制造的OPA100運算放大器的偏置電壓的标準偏差,則應從15個分量的樣本中收集數據,然後在計算标準偏差時将其除以14而不是15。
垂
直線表示電壓值,該電壓值是樣本平均值上下的一個标準偏差。在計算标準偏差時,我用除以N-1。
同樣,如果要基于相對較短的數據采集時間來量化電壓信号的噪聲,則可以除以N-1。在這種情況下,數字化數據就是樣本,信号本身就是群體。
您還可以這樣認為:當我們除以N-1時,我們将重點放在在分析信号中産生噪聲的潛在過程上,而不是在由采集信号所代表的時間段内測量這些過程的影響。
樣本量的影響
工程師的直覺可能會告訴您,貝塞爾的校正不是那種會影響或破壞您的分析的事情,在許多情況下,這是正确的。在工程應用中,我們經常有大量的數據,并且我們直觀地認識到這些大數據集将産生一個樣本均值,就所有實際目的而言,該均值與總體均值相同。因此,無需除以N-1即可除以N。
但是,我們應該記住,這種關系已内置在更正中。随着N的增加,相對于整體計算,N和N-1之間的差異變得不那麼重要。因此,當需要進行補償時(即,樣本量較小時),使用N-1可施加理想的補償;而當不需要補償時(即,樣本量較大時),則N-1不會産生明顯的影響。
結論
我們已經看到,可以根據分析意圖和樣本量以不同方式計算标準偏差。在下一篇文章中,我們将探讨标準差與均方根值之間的關系。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!