俄羅斯數學家切比雪夫在用标準差來度量離差的情況下,提出并證明了以下不等式。
切比雪夫不等式:對有限方差的任何變量,算數均值的k個标準差内,觀測值的數量比例最少是1-1/k^2。其中k大于1。
例如當k=1.25,根據不等式,位于正負1.25個标準差内的觀測值占總體觀測值的比例不低于36%。最常用的是,圍繞均值的兩個标準差區間内至少包含75%的觀測值。三個标準差區間内至少包含89%的觀測值。以上并不用考慮觀測值是如何分布的。
切比雪夫不等式重要性來自于他的普适性,不等式不管分布形狀如何,不管是對樣本還是總體,不管是連續還是離散都成立。當然,如果我們知道分布的具體情況,例如是正态分布,那麼得到的區間可能會更精确。
我們注意到标準方差相比方差更容易解釋,因為标準方差使用與觀測值相同的測量單位。在不同數據集之間解釋相對變異程度時,有時候我們可能很難解釋标準差意味着什麼,這是因為數據集之間均值可能有很大的不同,也有可能數據集之間的測量單位不同。在這部分,我們引入一種相對偏離程度的測量方法,變異系數,這種方法在以上問題中會發揮很大作用。相對偏離程度是相對一個參考值或基準的偏離程度值。
我們可以設計一個例子,第一個樣本全部是小公司的年生産規模,分别是50萬、75萬、65萬、90萬。第二個樣本全部是大公司的年生産規模,分别是800萬、825萬、815萬、840萬。我們可以計算,這兩個樣本的标準方差都是16.8萬。在第一個樣本中最大觀測值比最小觀測值大90%,第二個隻大5%。通常以上數據署名,标準方差16.8萬表示,第一個樣本中,相對均值70萬有16.8萬的變異程度,第二樣本中,相對均值820萬有168萬的變異程度,顯然第一個樣本的風險比第二個樣本的風險更高。變異系數在描述上面兩個樣本風險大小時會很有用。
變異系數的定義:變異系數是觀測集合的标準差于均值的比值。
當觀測值是回報率,變異系數測量每單位均值的風險(标準方差)值。變異系數的
含義在投資上還可以演變為夏普比率,夏普比率測量證券在單位方差下的風險回報溢價。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!