二十二·(1)相關分析(correlation analysis)

先將上表數據按直角坐標作出圖22-2。從該圖的點子分佈可以看出,尿中雌三醇濃度愈高,新生兒體重愈大;這群點子的分佈基本上呈直線趨勢。

yufangyixue124.jpg


圖22-2 待產婦尿雌三醇含量與產兒出生體重相關圖

(一)相關系數(correlation coefficient)

相關系數是表示兩個變量(X,Y)之間線十性十關系密切程度的指標,用r表示,其值在-1至+1間。如兩者呈正相關,r呈正值,r=1時為完全正相關;如兩者呈負相關則r呈負值,而r=-1時為完全負相關。完全正相關或負相關時,所有圖點都在直線回歸線上;點子的分佈在直線回歸線上下越離散,r的絕對值越小。當例數相等時,相關系數的絕對值越接近1,相關越密切;越接近於0,相關越不密切。當r=0時,說明X和Y兩個變量之間無直線關系。計算相關系數的公式為:

yufangyixue125.jpg


為瞭獲得公式22.2中各數據,先將表22-1資料進行計算如表22-2。

從表22-2的計算獲得

ΣX=534 ΣX2=9876 ΣY=99.2ΣY2=324.18 ΣXY=1750

N=31

按這些數據進一步以下演算求r。

yufangyixue126.jpg


(二)相關系數的假設檢驗

本例題31例,隻是總體中一個樣本,由此求得的相關系數,必然存在十抽十樣誤差。總體相關系數為零(ρ=0)時,從這總體中十抽十出31例,因為十抽十樣誤差,r也可能不等於0。氙以要判斷該樣本r是否有意義,需與總體相關系數,ρ=0比較,看兩者的差別有無統計不學意義。

相關系數的假設檢驗,可用t檢驗,公式如下:

公式(22.2)

自十由度v=n-2

H0:ρ=0

H1:ρ≠0

α=0.05

本例r=0.6097,n=31,代入公式(22.2)

表22-2 相關系數計算表


尿雌三醇X(mg/24h)(1)X2(2)初生兒體重Y(kg)(3)Y2(4)XY(5)
7492.56.2517.5
9812.56.2522.5
9812.56.2522.5
121442.77.2932.4
141962.77.2937.8
162562.77.2943.2
162562.45.7638.4
141963.09.0042.0
162563.09.0048.0
162563.19.6149.6
172893.09.0051.0
193613.19.6158.9
214413.09.0063.0
245762.87.8467.2
152253.210.2448.0
162563.210.2451.2
172893.210.2454.4
256253.210.2480.0
277293.411.5691.8
152253.411.5651.0
152253.411.5651.0
152253.512.2552.5
162563.512.2556.0
193613.411.5664.6
183243.512.2563.0
172893.612.9661.2
183243.713.6966.6
204003.814.4476.0
224844.016.0288.0
256253.915.2197.5
245764.318.49103.2
534987699.2324.181750.0


V=31-2=29

查t值表,t0.01(29)=2.756,本例tr=4.1423>t0.01(29),P<0.01,按α=0.05水準拒絕H0,接受H1,可以認為臨產婦24小時尿中雌三醇濃度與初生兒體重有正相關關系。

如果不用t檢驗,可以根據v查相關系數r界值表(附表22-1)。本例v=29,查表得知r0.01(29)值為0.456,而本例r=0.6097>r0.01(29),故P<0.01,與上述t檢驗的結果一致。

《預防醫學》