公衛醫師醫學統計學輔導:計算相關與回歸的注意事項

1.作相關與回歸分析要有實際意義。不要把毫無關聯的兩個事物或現象用來作相關或回歸分析。如兒童身高的增長與小樹的增長,作相關分析是沒有實際意義的,如果計算由兒童身高推算小樹高的回歸方程則更無實際意義。也許算得的r、b是顯著的,也是沒有意義的。 2.對相關分析的作用要正確理解。相關分析只是以相關係數來描述兩個變數間相互關係的密切程度和方向,並不能闡明兩事物或現象間存在聯繫的本質。而且相關並不一定就是因果關係,切不可單純依靠相關係數或回歸係數的顯著性“證明”因果關係之存在。要證明兩事物間的因果關係,必須憑籍專業知識從理論上加以闡明。但是,當事物間的因果關係未被認識前,相關分析可為理論研究提供線索。來源:

3.相關與回歸的區別和聯繫:相關表示兩變數間的相互關係,是雙方向的。而回歸則表示y隨x而變化,這種關係是單方向的。醫學資料中的有些資料用相關表示較適宜,比如兄弟與姐妹間的身長關係、人的身長與前臂長之間的關係等資料。另有些資料用相關和回歸都適宜,此時須視研究需要而定。就一般計算程式來說,是先求出相關係數r並對其進行假設檢驗,如果r顯著並有進行回歸分析之必要,再建立回歸方程。

回歸係數與相關係數的正負號都有兩變數離均差積之和的符號業決定,所以同一資料的b與其r的符號相同。回歸係數有單位,形式為(應變數單位/自變數單位)相關係數沒有單位。相關係數的範圍在-1~+1之間,而回歸係數沒有這種限制。來源:

4.適合作相關和回歸分析的資料通常有兩種資料:(1)一個變數x是選定的,另一個變y是從常態分配的總體中隨機抽取的,宜作回歸分析。(2)兩變數x、y(或x1、x2)都是從常態分配的總體中隨機抽取的,即是正態雙變數中的隨機樣本。這時,若需要由一個變數推算另一個變數可作回歸分析;若只需說明兩變數間的相互關係可作相關分析。如果變數(一個或兩個)呈明顯偏態時,須經過適當的變數代換(如對數代換等),使資料接受常態分配後再做相關與回歸分析;或者採用秩相關法。

5.在回歸分析中,由x推算y與由y推算x的回歸方程是不同的,不可混淆。

但我們必須正確選定自變數與應變數,一般說,事物的原因作自變數x,當事物的因果關係不很明確時,選誤差較小的即個體變異小的變數作自變數x,以推算應變數y。來源:

6.回歸方程的適用範圍有其限度,一般僅適用於自變數x的原數據範圍內,而不能任意外推。因為我們並不知道在這些觀察值的範圍之外,兩變數間是否也呈同樣的直線關係。