質量工程師輔導:抽樣統計知識1

根據中心極限定理,任何一種連續型隨機變數,不管它本身的圖形如何,只要它的樣本個數超過30個,
它的均值就可以視為服從常態分配.
抽樣統計學原理概要
我們從一個總數為n的群體中選取n個樣本,並估計參數μ和σ2,即樣本容量和方差。
可以用這兩個參數來描述分布狀態,尤其是常態分配。
隨機性確保了群體中的每個單元都有均等的入選機會,它排除了選擇的偏差。估計值ā和s2,
即樣本的平均值和方差都有它們各自的分布形式,我們常假定常態分配是最佳分布形式。
可以用這種分布來估計z的機率和正態偏差(即用t分布估計t的機率)或者形成確定樣本數的z、t分布表。
有許多種隨機取樣方法,最簡單的是對隨機性沒有限制的簡單隨機取樣。
例如,如果一個取樣區域的一部分是斜坡,而另一部分是平地,那么,這兩個部分應該分別進行取樣分析和解釋。
我們可以對隨機性附加些限定條件,如在分層隨機取樣中我們希望去除層次之間的變異,
其限制條件是在每一個層次中都分別隨機性處理。在簡單隨機取樣中,樣本平均值總是群體平均值的無偏估計值。
我們談到的“最優”估計值是指它的取樣方差最小。
其結果是樣本平均值和樣本方差都能達到最優等。
人們經常想到的是樣本的大小。如果樣本的採集方法合適,我們知道,取樣分數n/n小,
它的值就很難保證估計的精確度,其有效精確度依賴於樣本數絕對值。這也就意味著在估計最佳樣本數時,
有必要考慮絕對樣本數,而不是樣本百分數。在確定樣本數的公式中,經常用n而不用n/n。
從樣本數和精確度考慮,樣本平均值ā的精確度隨樣本數的提高而提高。
在不考慮抽樣群體的總體形狀時,樣本均值ā隨樣本數的增大而更接近於常態分配,它的根據是中心極限定理。30個樣本對於標準估計是足夠的(但是,我們也可以抽取超過30個的樣本從而達到必要的精確度)。
這種假設關係的根據是,方差是有限的,而從總體中抽取樣本是隨機的。