公衛醫師醫學統計學輔導:樣本含量的估計

一、估計樣本含量的意義及條件

我們在第一節里曾提到重複的原則。所謂重複,是指各處理組(對照在實驗研究中也被看作是一種處理,而且是必不可少的)的受試對象都應有一定的數量,例數不能太少,所以在抽樣調查、臨床觀察或實驗研究中,首先總要考慮樣本含量(或叫樣本大小)問題。樣本太小,使應有的差別不能顯示出來,難以獲得正確的研究結果,結論也缺乏充分的依據;但樣本太大,會增加實際工作中的困難,對實驗條件的嚴格控制也不易做到,並且造成不必要的浪費。所以這裡所說的樣本含量估計,系指在保證研究結論具有一定可靠性的條件下,確定最少的觀察或實驗例數。來源:

但是,樣本含量又是個比較複雜的問題。要講清在各種情況下估計樣本含量的方法和原理,那是很繁雜的。而且,不同的參考書上介紹的計算公式和工具表往往不一樣,以致同一問題所得的結果也可能有出入。所以,不論按哪種公式或工具表求得的結果,也只能是個近似的估計數。

估計樣本含量,必須事先明確一些條件與要求:

(一)根據研究目的與資料性質,要先知道一些數據。例如要比較幾組計數資料,先要知道百分數或率;要比較幾組計量資料,先要知道平均數及標準差。這些數據可從以往的實踐,預備試驗的結果、兄弟單位的經驗或文獻資料里得來。來源:

(二)確定容許誤差。由於抽樣誤差的影響,用樣本指標估計總體指標常有一定的誤差,因而要確定一個樣本指標與總體指標相差所容許的限度。此值要求越小,所需例數就越多。

(三)確定把握度(1—β)。β是第二型錯誤的機率;而1—β的意思是:如果兩組確有差別,則在每100次實驗中平均能發現出差別來的機率。把握度可用小數(或百分數)表示,一般取0.99、0.95、0.90、0.80、0.50。要求把握度越高,則所需例數直多。

(四)確定顯著性水平,即第一型錯誤的機率(α)。這就是希望在α=0.05的水準上發現差別,還是希望在α=0.01的水準上發現差別。α越少,所需例數越多。

此外,估計樣本含量時還應當根據專業知識確定用單側檢驗或雙側檢驗。同一實驗,若既可用單側檢驗又可用雙側檢驗,則前者所需例數要少些。

二、用計算法估計樣本含量來源:

我們運用前面學過的某些假設檢驗公式,就可以進行樣本含量的計算。下面僅舉兩例略作介紹。這裡的公式僅適用於α=0.05,1—β=0.50。而且都是雙側檢驗。

(一)兩個率比較時樣本含量的計算 令n為每組所需例數,p1、p2為已知的兩個率(用小數表示),p為合併的率,當設兩組例數相等時,即p=(p1+p2)/2。q=1=p,則

(11.1)

  例11.5 據某院初步觀察,用甲、乙兩種藥物治療慢性氣管炎患者,近控率甲藥為45%,乙藥為25%。現擬進一步試驗,問每組需觀察多少例,才可能在α=0.05的水準上發現兩種療法近控率有顯著相差?

本例p1=0.45,p2=0.25,p=(0.45+0.25)÷2=0.25,q=1-0.35=0.65,代入式11.1

 

每組需觀察46人,兩組共觀察92人,注意:例數問題不同於一般數學計算中的四捨五入,凡是有小數的值,應一律取稍大於它的正整數,如本例45.5取46,若為45.1也應取46。

(二)個別比較t檢驗樣本含量的計算 令n為所需樣本數,s為差數的標準差,x為差數的均數,t0.05o為t值表上相當於p=0.05的t值,4為n足夠大時t20.05=1.962的數,則

大樣本 (11.2)

小樣本 (11.3)

例11.6 用某藥治療胃及十二指腸潰瘍病人,服藥四周后胃鏡複查時,患者潰瘍面平均縮小0.2cm2,標準差為0.4cm2,假定該藥確能使潰瘍面縮小或癒合,問需多少病人作療效觀察才能在α=0.05的水準上發出用藥前後相差顯著?