公衛醫師醫學統計學輔導:非參數統計非參數統計

什麼叫非參數統計?先從參數統計說起。總體的特徵值叫參數,一些特定分布都有其參數,如常態分配由μ、σ兩個參數所決定。有些統計方法是根據特定分布設計出來的,如估計正常值範圍的常態分配法、u檢驗等是根據常態分配設計出來的,這樣的一些方法統稱為參數統計,前邊已學過的t檢驗和方差分析都屬於參數統計。但在實際工作中,有些資料不易判定或不符合所要求的分布,因此就需要有這樣一些統計方法,它不受由參數所決定的特定分布的限制而適用於任意分布,這類統計方法稱為非參數統計(non-parametric statistics)或稱不拘分布distribution-free)的統計。 用非參數統計法處理資料時所比較的是分布而不是參數。它不考慮資料的分布類型,直接用樣本數據的符號、大小順序號、綜合判斷劃分的名次、嚴重程度、優劣等級等作比較。

非參數統計的優缺點是:

方法簡便、易學易用,要求資料所具備的條件不像參數法那樣嚴格,因而易於推廣使用。另外,參數法難以處理的等級資料,非參數法卻能加以分析,故其套用範圍廣泛。

但如果已知資料所屬總體近似於常態分配,或者資料經代換後可呈某種特定分布,那末,非參數統計法所得信息就不及參數統計法多,當檢驗假設錯誤時,非參數統計發現差異的靈敏度也較低。

當資料中例數並不太少時,用非參數統計所得的結論常和用參數統計法相同,但當統計結果在顯著性界線附近時,兩者結論可能不同,此時,若資料具備參數統計要求的條件,則以參數統計結論較合理,若資料不具備參數統計要求的條件,則非參數統計的結論可能準確些。

在下述情況下非參數統計可作為首選方法:

1.各種資料的初步分析;

2.某種標誌不便準確的測量,而只能以嚴重程度、優劣等級、成效大小、名次先後或綜合判斷等方式定出次序時;

3.資料的分布類型不能確定時;

4.綜合分析同質性較差的資料時,如不同地點,不同年份的某種實驗結果等;

5.組內個別數據偏離過大,或各組內變異相差懸殊時。