1.1單因素方差分析
1.1.1數據結構
1.1.2分析步驟
(1)提出假設
(2)構造檢驗統計量
(3)統計決策
(4)方差分析表
(5)用Excel進行方差分析
1.1.2.1提出假設
1.1.2.2構造檢驗的統計量
1.為檢驗H0是否成立,需确定檢驗的統計量
2.構造統計量需要計算
(1)水平的均值
(2)全部觀察值的總均值
(3)離差平方和
(4)均方(MS)
1、計算水平的均值
結合表3的數據結構進行說明:假定從第i個總體中抽取一個容量為ni的簡單随機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數
計算公式為
2、計算全部觀察值的總均值
全部觀察值的總和除以觀察值的總個數
計算公式為
式中,n=n1 n2 … nk
例1分析
3、計算各誤差平方和
1. 每個水平或組的各樣本數據與其組平均值的離差平方和
2. 反映每個樣本各觀察值的離散狀況,又稱組内平方和
3. 該平方和反映的是随機誤差的大小
4. 計算公式為
補充例計算結果
構造檢驗的統計量(計算誤差項平方和SSE)
1. 每個水平或組的各樣本數據與其組平均值的離差平方和
2. 反映每個樣本各觀察值的離散狀況,又稱組内離差平方和
3. 該平方和反映的是随機誤差的大小
4. 計算公式為
構造檢驗的統計量(三個平方和的關系)
總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之前的關系
構造檢驗的統計量(三個平方和的作用)
1.SST反映了全部數據總的誤差程度;SSE反映了随機誤差的大小;SSA反映了随機誤差和系統誤差的大小
2.如果原假設成立,即H1=H2=…=Hk為真,則表明沒有系統誤差,組間平方和SSA除以自由度後的均方與組内平方和SSE和除以自由度後的均方差異就不會太大;如果組間均方顯著地大于組内均方,說明各水平(總體)之間的差異不僅有随機誤差,還有系統誤差
3.判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組内方差之間差異的大小
4.為檢驗這種差異,需要構造一個用于檢驗的統計量
計算統計量——計算均方MS
1.各離差平方和的大小與觀察值的多少有關,為了消除觀察值多少對離差平方和大小的影響,需要将其平均,這就是均方,也稱為方差
2.計算方法是用離差平方和除以相應的自由度
3.三個平方和的自由度分别是
(1)SST的自由度為n-1,其中n為全部觀察值的個數
(2)SSA的自由度為k-1,其中k為因素水平(總體)的個數
(3)SSE的自由度為n-k
組間方差:SSA的均方,記為MSA,計算公式為
MSA=SSA/(k-1)
組内方差:SSE的均方,記為MSE,計算公式為
MSE=SSE/(n-k)
計算檢驗的統計量F
将MSA和MSE進行對比,即得到所需要的檢驗統計量F
當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k 的F 分布,即
F=MSA/MSE~F(k-1,n-k)
構造檢驗的統計量(F分布于拒絕域)
1.1.2.3統計決策
将統計量的值F與給定的顯著性水平a的臨界值Fa進行比較,作出接受或拒絕原假設H0的決策
(1)根據給定的顯著性水平a,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應的臨界值Fa
(2)若F>Fa,則拒絕原假設H0,表明均值之間的差異是顯著的,所檢驗的因素(A)對觀察值有顯著影響
(3)若FFa,則不能拒絕原假設H0,表明所檢驗的因素(A)對觀察值沒有顯著影響
單因素方差分析表(基本結構)
例10.1題方差分析結果
【例】為了對幾個行業的服務質量進行評價,消費者協會在零售業、旅遊業、航空公司、家電制造業分别抽取了不同的樣本,其中零售業抽取7家,旅遊業抽取了6家,航空公司抽取5家、家電制造業抽取了5家,然後記錄了一年中消費者對總共23家服務企業投訴的次數,結果如表9.7。試分析這四個行業的服務質量是否有顯著差異?(a=0.05)
1.1.3關系強度的測量
1.拒絕原假設表明因素(自變量)與觀測值之間有關系
2.組間平方和(SSA)度量了自變量(行業)對因變量(投訴次數)的影響效應
(1)隻要組間平方和SSA不等于0,就表明兩個變量之間有關系(隻是是否顯著的問題)
(2)當組間平方和比組内平方和(SSE)大,而且大到一定程度時,就意味着兩個變量之間的關系顯著,大得越多,表明它們之間的關系就越強。反之,就意味着兩個變量之間的關系不顯著,小得越多,表明它們之間的關系就越弱
變量間關系的強度用自變量平方和(SSA)及殘差平方和(SSE)占總平方和(SST)的比例大小來反映
自變量平方和占總平方和的比例記為
,即
其平方根R就可以用來測量兩個變量之間的關系強度
1.1.4方差分析中的多重比較
1.多重比較是通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異
2.多重比較方法有多種,這裡介紹Fisher提出的最小顯著差異方法,簡寫為LSD,該方法可用于判斷到底哪些均值之間有差異
3.LSD方法是對檢驗兩個總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的
1.1.5用Excel進行方差分析
第1步:選擇“工具”下拉菜單
第2步:選擇“數據分析”選項
第3步:在分析工具中選擇“單因素方差分析”,然後選擇“确定”
第4步:當對話框出現時
在“輸入區域”方框内鍵入數據單元格區域
在a方框内鍵入0.05(可根據需要确定)
在“輸出選項”中選擇輸出區域
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!