公衛醫師醫學統計學輔導：非參數統計非參數統計

什麼叫非參數統計？先從參數統計說起。總體的特徵值叫參數，一些特定分布都有其參數，如常態分配由μ、σ兩個參數所決定。有些統計方法是根據特定分布設計出來的，如估計正常值範圍的常態分配法、u檢驗等是根據常態分配設計出來的，這樣的一些方法統稱為參數統計，前邊已學過的t檢驗和方差分析都屬於參數統計。但在實際工作中，有些資料不易判定或不符合所要求的分布，因此就需要有這樣一些統計方法，它不受由參數所決定的特定分布的限制而適用於任意分布，這類統計方法稱為非參數統計(non-parametric statistics)或稱不拘分布distribution-free)的統計。用非參數統計法處理資料時所比較的是分布而不是參數。它不考慮資料的分布類型，直接用樣本數據的符號、大小順序號、綜合判斷劃分的名次、嚴重程度、優劣等級等作比較。

非參數統計的優缺點是：

方法簡便、易學易用，要求資料所具備的條件不像參數法那樣嚴格，因而易於推廣使用。另外，參數法難以處理的等級資料，非參數法卻能加以分析，故其套用範圍廣泛。

但如果已知資料所屬總體近似於常態分配，或者資料經代換後可呈某種特定分布，那末，非參數統計法所得信息就不及參數統計法多，當檢驗假設錯誤時，非參數統計發現差異的靈敏度也較低。

當資料中例數並不太少時，用非參數統計所得的結論常和用參數統計法相同，但當統計結果在顯著性界線附近時，兩者結論可能不同，此時，若資料具備參數統計要求的條件，則以參數統計結論較合理，若資料不具備參數統計要求的條件，則非參數統計的結論可能準確些。

在下述情況下非參數統計可作為首選方法：

1.各種資料的初步分析；

2.某種標誌不便準確的測量，而只能以嚴重程度、優劣等級、成效大小、名次先後或綜合判斷等方式定出次序時；

3.資料的分布類型不能確定時；

4.綜合分析同質性較差的資料時，如不同地點，不同年份的某種實驗結果等；

5.組內個別數據偏離過大，或各組內變異相差懸殊時。