二十五·(5)資料處理及分析

在整理數據之前,首先對每一份原始資料進行查核,有無未填寫或填寫錯誤的表格,資料是否完整,將不合格的資料剔除,填寫不清楚或不詳的資料歸屬在“不詳”項,然後對可用的原始資料進行清點與分組。如采用計算機分析,則按設計和程序及相應的編碼,由調查進行編碼,輸入電子計算機儲存,供分析用。

數據整理應有層次,由粗至細,層層深入,循序漸進。一般從整理描述十性十數據入手,可按種種不同的特十性十進行分組,例如人群可按十性十別、年齡、職業等分組;地區按城鄉等;時間按年、月、周等。分組的粗細按具體的需要而定,並計算率與均數來描繪它的分佈及變動趨勢等,可初步發現各因素與疾病間的關系,存在何種差異。爾後對各單因素之間采用對比或相關的統計方法,分析各因素之間有無相關及相關的程度等。經這樣處理後已能顯示出數據的主要特征及各數據間的關系,對研究結果可有初步的結論。在整理過程中如發現影響疾病的因素是復雜的,且可能是多因素的綜合作用,則需作多因素分析。

在整理資料時首先要擬整理表。例如整理吸煙十習十慣與肺癌死亡的關系時,需獲得吸煙與不吸煙的總人數及他們中死於肺癌的總人數,這兩數據必須按表27-3形式獲得。

表27-3 吸煙十習十慣與肺癌死亡調查數據整理表


吸煙十習十慣調查人數肺癌死亡人數死亡率(1/10萬)
吸煙   
不吸煙   


表27-4 某人群吸煙量與肺癌死亡調查數據整理表


吸煙情況(支/日)調查人數因肺癌死亡人數死亡率(1/10萬)
不吸   
1~   
11~   
21~   


如需分析吸煙量的多少與肺癌死亡關系時,可按表27-4的形式加以整理,即可獲得吸煙劑量與肺癌死亡的關系。

在分析過程中如發現有兩種因素十十交十十織在一起,當要確定以何者為主要因素時,可采用叉生法來排除非主要因素。例如1975年,某單位發生由冷飲引起的細菌十性十痢疾爆發,經初步調查可能為飲用豆漿或冰棍所致,但以何者為主呢?經叉生法分析,從表27-5可見,單吃豆漿比單吃冰棍的罹患率要高得多,從而獲得飲用豆漿為這次細菌十性十痢疾爆發的主要因素。

表27-5 不同冷飲史與罹患率的關系


吃冷飲史發病不發病合計罹患率RR
豆漿冰棍
517780129739.8646.3
5910816735.3341.1
666657319.0310.05
13150215150.861


X2=807.24自十由度=3P<0.001

資料來源:錢宇平等,流行病學1987

《預防醫學》