公衛醫師醫學統計學輔導:常態分配及其性質

常態分配及其性質 一群變數值可能用平均數描述集中的位置,用變異指標描述離散情況,而頻數表則把變數值的分布描繪得更具體。為了直觀還可把頻數表畫成直方圖。如第四章中曾將7歲男童坐高的頻數分布繪成圖4.1。從圖中可看出數據集中均數周圍,左右基本對稱,離均數愈近數據愈多,離均數愈遠數據愈少的特點。醫學科研中如健康人的紅細胞數、血紅蛋白量、血清總膽固醇,同年齡同性別兒童的身高、體重等,雖然數據各異,但畫出的直方圖圖形是類似的。可以構想,這種類型的資料,如果調查例數無限增多,所用組距又無限的小,那么直方頂端就連成了一條光滑的曲線。這條曲線,典型地反映了這類資料的分布情況,數學上稱為正態曲線,其方程為來源:

式中n為總頻數,x為變數值,μ為均數,σ為標準差,y為縱高,e=2.71828……,π=3.14158……。在一個總體中n、μ、σ、e、π都是常數,只有x在變,所以y=f(x)。來源:

式(5.1)亦可寫成:

由上式可看出曲線的性質:

1.曲線左右對稱。x-μ無論是正或負,只要絕對值就相等,y值就相等。所以只要x與μ的距離相等,y就相等。y值以x=μ為對稱軸。來源:

2.中位數、均數、眾數重合。正態曲線在橫軸上方。當x=μ時,e0=1,y為極大,所以均數與眾數密合。由於曲線左右對稱,所以均數亦即中位數。e的指數愈大,y愈小,但不會得負值,所以y>0,曲線在橫軸上方。

3.隨著(x-μ/σ)的絕對值的增加,曲線由平均數所在點向左右兩方迅速下降。來源:

4.離平均數左右1σ處為曲線拐點。在μ±σ以內曲線向下彎曲,以外則向上彎曲。

這種類型的資料,數據值雖各不相同,但都有其均數與標準差,如果橫軸上各以其均數為原點,標準差為單位,並令x=x-μ,那么(x-μ)/σ可寫成x/σ,稱為正態離差u,

(5.2)

再令總頻數為1。 這時曲線以μ為原點,以σ為單位,稱為標準正態曲線,其公式為

(5.3)

以μ為均數,σ2為方差的常態分配可記為n(μ,σ2),因此標準常態分配可記為n(0,1)。 來源:

圖5.2 標準正態曲線 來源: