質量工程師:方差分析(ANOVA)

方差分析(anova)

一、方差分析的基本思想
1. 方差分析的概念

方差分析(anova)又稱變異數分析或f檢驗,其目的是推斷兩組或多組資料的總體均數是否相同,檢驗兩個或多個樣本均數的差異是否有統計學意義。我們要學習的主要內容包括單因素方差分析即完全隨機設計或成組設計的方差分析和兩因素方差分析即配伍組設計的方差分析。

2. 方差分析的基本思想

下面我們用一個簡單的例子來說明方差分析的基本思想:

如某克山病區測得11例克山病患者和13名健康人的血磷值(mmol/l)如下,

患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11

健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87

問該地克山病患者與健康人的血磷值是否不同?

從以上資料可以看出,24個患者與健康人的血磷值各不相同,如果用離均差平方和(ss)描述其圍繞總均數的變異情況,則總變異有以下兩個來源:

(1)組內變異,即由於隨機誤差的原因使得各組內部的血磷值各不相等;

(2)組間變異,即由於克山病的影響使得患者與健康人組的血磷值均數大小不等。

而且:ss總=ss組間+ss組內 v總=v組間+v組內

如果用均方(即自由度v去除離均差平方和的商)代替離均差平方和以消除各組樣本數不同的影響,則方差分析就是用組內均方去除組間均方的商(即f值)與1相比較,若f值接近1,則說明各組均數間的差異沒有統計學意義,若f值遠大於1,則說明各組均數間的差異有統計學意義。實際套用中檢驗假設成立條件下f值大於特定值的機率可通過查閱f界值表(方差分析用)獲得。

3. 方差分析的套用條件

套用方差分析對資料進行統計推斷之前應注意其使用條件,包括:

(1)可比性,若資料中各組均數本身不具可比性則不適用方差分析。

(2)正態性,即偏態分布資料不適用方差分析。對偏態分布的資料應考慮用對數變換、平方根變換、倒數變換、平方根反正弦變換等變數變換方法變為正態或接近正態後再進行方差分析。

(3)方差齊性,即若組間方差不齊則不適用方差分析。多個方差的齊性檢驗可用bartlett法,它用卡方值作為檢驗統計量,結果判斷需查閱卡方界值表。

二、方差分析的主要內容

根據資料設計類型的不同,有以下兩種方差分析的方法:

1. 對成組設計的多個樣本均數比較,應採用完全隨機設計的方差分析,即單因素方差分析。

2. 對隨機區組設計的多個樣本均數比較,應採用配伍組設計的方差分析,即兩因素方差分析。

兩類方差分析的基本步驟相同,只是變異的分解方式不同,對成組設計的資料,總變異分解為組內變異和組間變異(隨機誤差),即:ss總=ss組間+ss組內,而對配伍組設計的資料,總變異除了分解為處理組變異和隨機誤差外還包括配伍組變異,即:ss總=ss處理+ss配伍+ss誤差。整個方差分析的基本步驟如下:

(1) 建立檢驗假設;

h0:多個樣本總體均數相等。

h1:多個樣本總體均數不相等或不全等。

檢驗水準為0.05。

(2) 計算檢驗統計量f值;

(3) 確定p值並作出推斷結果。

三、多個樣本均數的兩兩比較
經過方差分析若拒絕了檢驗假設,只能說明多個樣本總體均數不相等或不全相等。若要得到各組均數間更詳細的信息,應在方差分析的基礎上進行多個樣本均數的兩兩比較。

1. 多個樣本均數間兩兩比較

多個樣本均數間兩兩比較常用q檢驗的方法,即 newman-kueuls法,其基本步驟為:建立檢驗假設-->樣本均數排序-->計算q值-->查q界值表判斷結果。

2. 多個實驗組與一個對照組均數間兩兩比較

多個實驗組與一個對照組均數間兩兩比較,若目的是減小第ii類錯誤,最好選用最小顯著差法(lsd法);若目的是減小第i類錯誤,最好選用新復極差法,前者查t界值表,後者查q’界值表。