二十·(6)x2檢驗

一、四格表資料的x2檢驗

例20.7某醫院分別用化學療法和化療結合放射治療十卵十巢癌腫患者,結果如表20-11,問兩種療法有無差別?

表20-11 兩種療法治療十卵十巢癌的療效比較

組別有效無效合計有效率(%)
化療組19244344.2
化療加放療組34104477.3
合計53348760.9

表內用虛線隔開的這四個數據是整個表中的基本資料,其餘數據均由此推算出來;這四格資料表就專稱四格表(fourfold table),或稱2行2列表(2×2 contingency table)從該資料算出的兩種療法有效率分別為44.2%和77.3%,兩者的差別可能是十抽十樣誤差所致,亦可能是兩種治療有效率(總體率)確有所不同。這裡可通過x2檢驗來區別其差異有無統計學意義,檢驗的基本公式為:

公式(20.12)

式中A為實際數,以上四格表的四個數據就是實際數。T為理論數,是根據檢驗假設推斷出來的;即假設這兩種十卵十巢癌治療的有效率本無不同,差別僅是由十抽十樣誤差所致。這裡可將兩種療法合計有效率作為理論上的有效率,即53/87=60.9%,以此為依據便可推算出四格表中相應的四格的理論數。茲以表20-11資料為例檢驗如下。

檢驗步驟:

1.建立檢驗假設:

H0:π1=π2

H1:π1≠π2

α=0.05

2.計算理論數(TRC),計算公式為:

TRC=nR.nc/n公式(20.13)

式中TRC是表示第R行C列格子的理論數,nR為理論數同行的合計數,nC為與理論數同列的合計數,n為總例數。

第1行1列: 43×53/87=26.2

第1行2列: 43×34/87=16.8

第2行1列: 44×53/87=26.8

第2行2列: 4×34/87=17.2

以推算結果,可與原四項實際數並列成表20-12:

表20-12 兩種療法治療十卵十巢癌的療效比較

組別有效無效合計
化療組19(26.2)24(16.8)43
化療加放療組34(26.8)10(17.2)44
合計533487

因為上表每行和每列合計數都是固定的,所以隻要用TRC式求得其中一項理論數(例如T1.1=26.2),則其餘三項理論數都可用同行或同列合計數相減,直接求出,示范如下:

T1.1=26.2

T1.2=43-26.2=16.8

T2.1=53-26.2=26.8

T2.2=44-26.2=17.2

3.計算x2值 按公式20.12代入

4.查x2值表求P值

在查表之前應知本題自十由度。按x2檢驗的自十由度v=(行數-1)(列數-1),則該題的自十由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001(1)=6.63,而本題x2=10.01即x2>x20.001(1),P<0.01,差異有高度統計學意義,按α=0.05水準,拒絕H0,可以認為采用化療加放療治療十卵十巢癌的療效比單用化療佳。

通過實例計算,讀者對卡方的基本公式有如下理解:若各理論數與相應實際數相差越小,x2值越小;如兩者相同,則x2值必為零,而x2永遠為正值。又因為每一對理論數和實際數都加入x2值中,分組越多,即格子數越多,x2值也會越大,因而每考慮x2值大小的意義時同時要考慮到格子數。因此自十由度大時,x2的界值也相應增大。

二、四格表的專用公式

對於四格表資料,還可用以下專用公式求x2值。

公式(20.14)

式中a、b、c、d各代表四格表中四個實際數,現仍以表20-12為例,將上式符號標記如下(表20-13),並示范計算。

表20-13 兩種療法治療十卵十巢腫瘤患者的療效

組別有效無效合計
化療組19(a)24(b)43(a+b)
化療加放療組34(c)10(d)44(c+d)
 53(a+c)34(b+d)87(n)

計算結果與前述用基本公式一致,相差0.01用換算時小數點後四舍五入所致。

三、四格表x2值的校正

x2值表是數理統計根據正態分佈中的定義計算出來的。隻是一種近似,在自十由度大於1、理論數皆大於5時,這種近似很好;當自十由度為1時,尤其當1<T<5,而n>40時,應用以下校正公式:

公式(20.15)

如果用四格表專用公式,亦應用下式校正:

公式(20.16)

例20.8某醫師用甲、乙兩療法治療小兒單純十性十消化不十良,結果如表20-14。試比較兩種療法效果有無差異?

表20-14 兩種療法效果比較的卡方較正計算

療法痊愈數未愈數合計
26(28.82)7(4.18)33
36(33.18)2(4.82)38
合計62971

從表20-14可見,T1.2和T2.2數值都<5,且總例數大於40,故宜用校正公式(20.15)檢驗。步驟如下:

1.檢驗假設:

H0:π12

H11≠π2

α=0.05

2.計算理論數:(已完成列入四格表括弧中)

3.計算x2值:應用公式(20.15)運算如下:

查x2界值表,x20.05(1)=3.84,故x2<x20.05(1),P>0.05.

按α=0.05水準,接受H0,兩種療效差異無統計學意義。

如果不采用校正公式,而用原基本公式,算得的結果x2=4.068,則結論就不同瞭。

如果觀察資料的T<1或n<40時,四格表資料用上述校正法也不行,可參考預防醫學專業用的醫學統計學教材中的十精十確檢驗法直接計算概率以作判斷。

四、行×列表的卡方檢驗(x2testfor R×C table)

適用於兩個組以上的率或百分比差別的顯著十性十檢驗。其檢驗步驟與上述相同,簡單計算公式如下:

公式(20.17)

式中n為總例數;A為各觀察值;nR和nC為與各A值相應的行和列合計的總數。

例20.9北方冬季日照短而南移,居宅設計如何適應以獲得最大日照量,增強居民體質,減少小兒佝僂病,實屬重要。十胡十氏等1986年在北京進行住宅建築日照衛生標準的研究,對214幢樓房居民的嬰幼兒712人十體檢,檢出輕度佝僂病333例,比較瞭居室朝向與患病的關系。現將該資料歸納如表20-15作行×列檢驗。

表20-15居室朝向與室內嬰幼兒佝僂病患病率比較

檢查結果居室朝向合計
西、西南東、東南北、東北、西北
患病1801412065379
無病200168433333
合計3803020498712
患病率(%)47.446.758.866.353.2

該表資料由2行4列組成,稱2×4表,可用公式(20.17)檢驗。

(一)檢驗步驟

1.檢驗假設

H0:四類朝向居民嬰幼兒佝僂病患病率相同。

H1:四類朝向居民嬰幼兒佝僂病患率不同。

α=0.05

2.計算x2

3.確定P值和分析

本題v=(2-1)(4-3)=3,據此查附表20-1:

x20.01(3)=11.34,本題x2=15.08,x2>x20.01(3),P<0.01,按α=0.05水準,拒絕H0,可以認為居室朝向不同的居民,嬰幼兒佝僂病患病率有差異。

(二)行×列表x2檢驗註意事項

1.一般認為行×列表中不宜有1/5以上格子的理論數小於5,或有小於1的理論數。當理論數太小可采取下列方法處理:①增加樣本含量以增大理論數;②刪去上述理論數太小的行和列;③將太小理論數所在行或列與十性十質相近的鄰行鄰列中的實際數合並,使重新計算的理論數增大。由於後兩法可能會損失信息,損害樣本的隨機十性十,不同的合並方式有可能影響推斷結論,故不宜作常規方法。另外,不能把不同十性十質的實際數合並,如研究血型時,不能把不同的血型資料合並。

2.如檢驗結果拒絕檢驗假設,隻能認為各總體率或總體構成比之間總的來說有差別,但不能說明它們彼此之間都有差別,或某兩者間有差別。

五、配對計數資料x2檢驗(x2testof paired comparison of enumeration data)

在計量資料方面,同一對象實驗前後差別或配對資料的比較與兩樣本均數比較方法有所不同;在計數資料方面亦如此。例如表20-16是28份咽喉塗抹標本,每份按同樣條件分別接種在甲、乙兩種白喉桿菌培養基中,觀察白喉桿菌生長情況,試比較兩種培養基的效果。

表20-16 兩種白喉桿菌培養基培養結果比較

甲培養基乙培養基合計
+-
+11(a)9(b)20
-1(c)7(d)8
合計121628

從表中資料可見有四種結果:(a)甲++,(b)甲+-(c)甲-+,(d)甲--;如果我們目的是比較兩種培養基的培養結果有無差異,則(a)、(d)兩種結果是一致的,對差異比較毫無意義,可以不計,我們隻考慮結果不同的(b)和(c),看其差異有無意義,可以應用以下簡易公式計算:

公式(20.18)

檢驗步驟:

1.檢驗假設

H0:π12

H11≠π2

α=0.05

2.計算x2

3.確定P值和分析 配對資料v=1,查附表20-1得知x20.05(1)=3.84,x2>x0.05(1),P<0.05,按α=0.05水準,拒絕H0,可以認為甲培養基的白喉桿菌生長效率較高。

如果b+c>40,則可采用:

公式(20.19)

此外還有兩種以上處理方法的比較,可參閱預防醫學專業的醫學統計方法有關章節。

附表20-1 x2界值表

vPVP
0.050.010.0010.050.010.001
13.846.6310.831626.3032.0039.25
25.999.2113.811727.5933.1440.79
37.8111.3416.271828.8734.1842.31
49.4913.2818.471930.1436.1943.82
511.0715.0920.522031.4137.5745.32
612.5916.8122.462132.6738.9346.80
714.0718.4824.322233.9240.2948.27
815.5120.0926.122335.1741.6449.73
916.9221.6727.882436.4242.9851.18
1018.3123.2129.592537.6544.3152.62
1119.6824.7231.262638.8945.6454.05
1221.0326.2232.912740.1146.9655.48
1322.3627.6934.532841.3448.2856.89
1423.6829.1436.122942.5649.5958.30
1525.0030.5837.703043.7750.8959.70
《預防醫學》