公衛醫師醫學統計學輔導:直線相關

一、相關係數的意義 相關分析是用相關係數(r)來表示兩個變數間相互的直線關係,並判斷其密切程度的統計方法。相關係數r沒有單位。在-1~+1範圍內變動,其絕對值愈接近1,兩個變數間的直線相關愈密切,愈接近0,相關愈不密切。相關係數若為正,說明一變數隨另一變數增減而增減,方向相同;若為負,表示一變數增加、另一變數減少,即方向相反,但它不能表達直線以外(如各種曲線)的關係。

為判斷兩事物數量間有無相關,可先將兩組變數中一對對數值在普通方格紙上作散點圖,如圖9.1~9.8所示。圖中點子的分布可出現以下幾種情況:

正相關——見圖9.1,各點分布呈橢圓形,y隨x的增加而增加,x亦隨y的增加而增加,此時1>r>0。橢圓範圍內各點的排列愈接近其長軸,相關愈密切,當所有點子都在長軸上時,r=1(見圖9.2),稱為完全正相關。

負相關——見圖9.3,各點分布亦呈橢圓形,y隨x的增加而減少,x也隨y的增加而減少,此時0>r>-1。各點排列愈接近其長軸,相關愈密切,當所有點子都在長軸上時,r=1(見圖9.4),稱為完全負相關。

在生物現象中,完全正相關或完全負相關甚為少見。

無相關——見圖9.5、圖9.6和圖9.7,x不論增加或減少,y的大小不受其影響;反之亦然。此時r=0。另外,須注意有時雖然各點密集於一條直線,但該直線與x軸或y軸平行,即x與y的消長互不影響,這種情況仍為無相關。

非線性相關——見圖9.8,圖中各點的排列不呈直線趨勢,卻呈某種曲線形狀,此時r≈0,類似這種情況稱為非線性相關。

圖9.1—9.8 不同相關係數的散點示意圖

二、相關係數的計算及假設檢驗

(一)相關係數計算法

計算相關係數的基本公式為:

(9.1)

式(9.1)中r為相關係數,∑(x-x)2為x的離均差平方和,∑(y-y)2為y的離均差平方和,∑(x-x)(y-y)為x與y的離均差乘積之和,簡稱離均差積之和,此值可正可負。以此式為基礎計算相關係數的方法稱積差法,在實際套用時式(9.1)中各離均差平方和(簡稱差方和)與積之和可化為

(9.2)

現舉例說明計算相關係數的一般步驟:

例9.1 測定15名健康成人血液的一般凝血酶濃度(單位/毫升)及血液的凝固時間(秒),測定結果記錄於表9.1第(2)、(3)欄,問血凝時間與凝血酶濃度間有無相關?

1.繪圖,將表9.1第(2)、(3)欄各對數據繪成散點圖,見圖9.9。

2.求出∑x、∑y、∑x2、∑y2、∑xy,見表9.1下方。

3,代入公式,求出r值。