十九·(4)方差分析

一、完全隨機設計的多個樣本均數的比較

又稱單因素方差分析。把總變異分解為組間(處理間)變異和組內變異(誤差)兩部分。目的是推斷k個樣本所分別代表的μ1,μ2,……μk是否相等,以便比較多個處理的差別有無統計學意義。其計算公式見表19-6。

表19-6 完全隨機設計的多個樣本均數比較的方差分析公式

變異來源離均差平方和SS自十由度v均方MSF
ΣX2-C*N-1  
組間(處理組間)k-1SS組間/v組間MS組間/MS組間
組內(誤差)SS-SS組間N-kSS組內/v組內 

*C=(ΣX)2/N=Σni,k為處理組數

表19-7 F值、P值與統計結論

αF值P值統計結論
0.05<F0.05(v1.V2)>0.05不拒絕H0,差別無統計學意義
0.05≥F0.05(v1.V2)≤0.05拒絕H0,接受H1,差別有統計學意義
0.01≥F0.01(v1.V2)≤0.01拒絕H0,接受H1,差別有高度統計學意義

方差分析計算的統計量為F,按表19-7所示關系作判斷。

例19.9 某湖水不同季節氯化物含量測量值如表19-8,問不同季節氯化物含量有無差別?

表19-8 某湖水不同季節氯化物含量(mg/L)

Xij
22.619.118.919.0
22.822.813.616.9
21.024.517.217.6
16.918.015.114.8
20.015.216.613.1
21.918.414.216.9
21.520.116.716.2
21.221.219.614.8
ΣXijj167.9159.3131.9129.3588.4(ΣX)
ni888832(N)
Xi20.9919.9116.4916.16 
ΣX2ijj3548.513231.952206.272114.1111100.84(ΣX2)
 
      
 

H0:湖水四個季節氯化物含量的總體均數相等,即μ1234

H1:四個總體均數不等或不全相等

α=0.05

先作表19-8下半部分的基礎計算。

C= (Σx)2/N=(588.4)2/32=10819.205

SS=Σx2-C=11100.84-10819.205=281.635

V=N-1=31

V組間=k-1=4-1=3

SS組內=SS-SS組間=281.635-141.107=140.465

V組內=N-k=32-4=28

MS組間=SS組間/v組間=141.107/3=47.057

MS組內=SS組內/v組內=140.465/28=5.017

F=MS組間/MS組內=47.057/5.017=9.380

以v1(即組間自十由度)=3,v2(即組內自十由度)=28查附表19-2,F界值表,得F0.05(3,28)=2.95,F0.01(3,28)=4.57。本例算得的F=9.380>F0.01(3,28),P<0.01,按α=0.05檢驗水準拒絕H0,接受H1,可認為湖水不同季節的氯化物含量不等或不全相等。必要時可進一步和兩兩比較的q檢驗,以確定是否任兩總體均數間不等。

資料分析時,常把上述計算結果列入方差分析表內,如表19-9。

表19-9 例19.9資料的方差分析表

變異來源SSvMSFP
組間141.170347.0579.38<0.01
組內140.465285.017  
281.63531   


二、隨機區組(配伍組)設計的多個樣本均數比較

又稱兩因素方差分析。把總變異分解為處理間變異、區組間變異及誤差三部分。除推斷k個樣本所代表的總體均數,μ1,μ2,……μk是否相等外,還要推斷b個區組所代表的總體均數是否相等。也就是說,除比較多個處理的差別有無統計學意義外,還要比較區組間的差別有無統計學意義。該設計考慮瞭個體變異對處理的影響,故可提高檢驗效率。

表19-10隨機區組設計的多個樣本均數比較的方差分析公式

變異來源離均差平方和SS自十由度v均方MSF
ΣX2-CN-1  
處理間k-1SS處理/v處理MS處理/MS誤差
區組間b-1SS區組/v區組MS區組MS誤差
誤差SS-SS處理-SS區組V-v處理-v區組SS誤差/v誤差 

C、k、N的意義同表19-6,b為區組數

例19.10為研究酵解作用對血糖濃度的影響,從8名健康人中十抽十血並制成血濾液。每個受試者的血濾液被分成4份,再隨機地把4份血濾液分別放置0,45,90,135分鐘,測定其血溏濃度(表19-11),試問放置不同時間的血糖濃度有無差別?

處理間:

H0:四個不同時間血糖濃度的總體均數相等,即μ1234

表19-11 血濾放置不同時間的血糖濃度(mmol/L)

區組號放置時間(分)受試者小計
ΣXij
j
04590135
15.275.274.944.6120.09
25.275.224.884.6620.03
35.885.835.385.0022.09
45.445.385.275.0021.09
55.665.445.384.8821.36
66.226.225.615.2223.27
75.835.725.384.8821.81
85.275.115.004.4419.82
ΣXij
j
44.8444.1941.8438.69169.56(ΣX)
Ni888832(N)
Xi5.60505.52385.23004.8363 
ΣX2ij
j
252.1996245.0671219.2962187.5585904.1214(ΣX2)

H1:四個總體均數不等或不全相等

α=0.05

區組間:

H0:八個區組的總體均數相等,即μ12=……μ8

H1:八個區組的總體均數不等或不全相等

α=0.05

先作表19-11下半部分和右側一欄的基本計算。

C=(ΣX)2/N=(169.56)2/32=898.45605

SS=ΣX2-C=904.1214-898.45605=5.66535

V=N-1=32-1=31

V處理=k-1=4-1=3

V區組=b-1=8-1=7

SS誤差=SS-SS處理-SS區組=5.66535-2.90438-2.49800=0.26297

V誤差=(k-1)(b-1)=3×7=21

MS處理=SS處理/v處理=2.90438/3=0.9681

MS區組=SS區組/v區組=2.49800/7=0.3569

MS誤差=SS誤差/v誤差=0.26297/21=0.0125

F處理=MS處理/MS誤差=0.9681/0.0125=77.448

F區組=MS區組/MS誤差=0.3569/0.0125=28.552

推斷處理間的差別,按v1=3,v2=21查F界值表,得F0.005(3,21)=3.07,F0.01(3,21)=4.87,P<0.01;推斷區組間的差別,按v1=7,v2=21查F界值表,得F0.05(7,21)=2.49,F0.01(7,21)=3.64,P<0.01。按α=0.05檢驗水準皆拒絕H0,接受H1,可認為放置時間長短會影響血糖濃度且不同受試者的血糖濃度亦有差別。但尚不能認為任兩個不同放置時間的血糖濃度總體均數皆有差別,必要時可進一步作兩兩比較的q檢驗。

表19-12 例19.10資料的方差分析表

變異來源SSvMSFP
處理間2.9043830.968177.448<0.01
區組間2.4980070.356928.552<0.01
誤差0.26297210.0125  
5.6653831   


三、多個樣本均數間的兩兩比較的q檢驗

經方差分析後,若按α=0.05檢驗水準不拒絕H0,通常就不再作進一步分析;若按α=0.05甚至α=0.01檢驗水準拒絕H0,且需瞭解任兩個總體均數間是否都存在差別,可進一步作多個樣本均數間的兩兩比較。兩兩比較的方法較多,在此僅介紹較常用的q檢驗(Newman-Keuls法)

公式(19.13)

(各組ni相等) 公式(19.14)

(各組ni不等) 公式(19.15)

式中,x-x為兩兩對比中,任兩個對比組A、B的樣本均數之差;sxA-xB為兩樣本均數差的標準誤;ni為各處理組的樣本含量;nA,nB分別為A、B兩對比組的樣本含量;MS誤差為單因素方差分析中的組內均方(MS組內)或兩因素方差分析中的誤差均方(MS誤差)。

計算的統計量為q,按表19-13所示關系作判斷。

例19.11 對例19.9資料作兩兩比較

H0:任兩個季節的湖水氯化物含量的總體均數相等,即μAB

H1:任兩總體均數不等,即μA≠μB

表19-13 |q| 值、P值與統計結論

α |q|P值統計結論
0.05<q0.05(v.a)>0.05不拒絕H0,差別無統計學意義
0.05≥q0.05(v.a)≤0.05拒絕H0。接受H1,差別有統計學意義
0.01≥q0.01(v.a)≤0.01拒絕H0,接受H1,差別有高度統計學意義

α= 0.05

1.將四個樣本的均數由大到小排列編秩,註明處理組。

xi167.9159.3131.9129.3
處理組
秩次1234

2.計算 sxA-xB本例各處理組的樣本含量n1相等,按式(19,14)計算兩均數差的標準誤。已知MS組內=5.017,n=8

3.列兩兩比較的q檢驗計算表(表19-14)

表19-14 兩兩比較的q檢驗計算表

A與B(1)x-x(2)組數,a(3)q值(4)=(2)/0.7919q0.05(v.a)

(5)

q0.01(v.a)(6)P值(7)




(1)與(4)38.6448.7443.854.80<0.01
(1)與(3)36.0345.4603.494.45<0.01
(1)與(2)8.6210.8602.893.89<0.01
(2)與(4)30.0337.8843.494.45<0.01
(2)與(3)27.4234.6002.893.89<0.01
(2)與(4)2.623.2832.893.89<0.05

表中第(1)欄為各對比組,如第一行1與4,指A為第1組,B為第4組。第(2)欄為兩對比組均數之差,如第一行為X1與X4之差,餘類推。第(3)欄為四個樣本均數按大小排列時,A、B兩對比組范圍內所包含的組數a,如第一“1與4”范圍內包含4個組,故a=4。第(4)欄是按式(19.13)計算的統計量q值,式中的分母0.7919是按式(19.14)計算出來的SXA-XB。第(5)、(6)欄是根據誤差自十由度v與組數a查附表19-3q界值表所得的q界值,本例v誤差=28,因q界值表中自十由度一欄無28,可用近似值30或用內插法得出q界值,本例用近似值30查表,當a=4時,q0.05(30,4)=3.85,q0.01(30,4)=4.80,餘類推。第(7)欄是按表19-13判定的。

4.結論由表19-14可見,除秋季與冬季為P<0.05外,其它任兩對比組皆為P<0.01,按α=0.05檢驗水準均拒絕H0,接受H1,可認為不同季節的湖水氯化物含量皆不同,春季氯化物含量最高,冬季含量最低。

《預防醫學》