LPI考試是如何開發的?

lpi考試的題目是按下列方法開發的:1.考試結構確定

在考試發展的第一階段，任務就是建立一個被認證者能做到什麼的總體觀念。當他們獲得了認證之後，他們能從事什麼工作？誰是目標市場？在總的認證計畫中，用什麼區分不同級別的認證？當1998年秋和1999年初我們考慮認證的不同模型和不同工作描述時，這樣的問題產生了。通過討論，我們列出了一個三級考試的計畫。一級將是初學者或初級linux系統管理者。二級將是高級管理者，而三極將是一非常高級的系統管理者。你可以將一個三級者看成是專家或linux領頭羊。注意：不同級別研究資料之一是由system administrator's guild (sage)建立起來的系統管理器工作描述。我們的考試不直接與這些工作描述相連，但是我們的1，2和3級考試都與sage的2，3和4級相似。

2.工作分析

以前有一對特定考試的工作描述（或構成一個級別認證的一組考試），下一步就是有目的性地和科學地決定適於這一工作的實際技能，任務和知識領域。這裡的問題就是，任何人都能提出他們認為一個linux管理者應該能執行的任務目錄。但是如果你問10 個不同的linux系統管理員，一個初級管理者應該做什麼，你將得到10 不同的答案。誰能說一個目錄比另一個更正確呢？事實就是，在10份不同的目錄中，將有所有目錄共有的任務。因此解決之法就是去詢問linux系統管理員，然後按照你能找到最一般和最重要問題的方法編輯這些答覆。在大多數與專業工作相連的測試程式，這一程式涉及工作分析調查和工作任務分析。工作分析的目的是確定在職者執行什麼任務和每一任務有什麼重要性。lpi對linux系統管理者進行了大量的工作分析。工作分析調查的第二目的就是合法保護考試目標的有效性。特別是在美國，當有可能在像認證這樣的證書的基礎上確定雇用決定時，就會有人控告認證團體，他們的考試有偏見且建立在不公平的基礎上。工作分析十分關鍵，它能證明考試目標的法律保護能力和阻止任何偏見的批評。

3.前期調查

在調查之前，第一步是關於與一些sme‘s一起合作，編輯一份冗長的，他們認為認證目標群隨時都將執行的任務的目錄。（lpi一級認證初級linux系統管理者）這一階段在1999年三月完成。

4.工作分析概況

我們把在前期調查中收集的任務組合到工作分析概況中。這一調查要求linux管理者用不同尺度來估價每一任務。尺度包括頻率（他們多久執行些任務），重要性（執行這一任務對管理者有多重要），還有級別。有 1,400人通過網路參加了調查。這一調查在1999年4月完成。數據分析接著，我們對工作調查的答覆作出了統計分析。我們平均地計算了統計顯示，答覆者估價每一任務有多重要。這一步於1999年4 月完成。

5.目標發展

下一步重要發展是使用從工作分析研究得到的結果來建立實際考試目標。目標表明了專業系統管理者所能做的特定的事情。每一目標都分配有一目標重值，表明了它們相對於其它目標的重量性。
前期目標草擬作為發展目標的第一步，一組有linux技能和心理測驗學原則知識的人，在工作分析調查的基礎上草擬了一組測試目標。這一步於1999年4月完成。 6.目標審查和修改

在草擬目標產生以後，它們被提交公眾審查和評論。一個叫poms 的網站被作此用。這一系統通過考試的內容來組織目標，顯示目標本身及與之相連的檔案。使用網路的形式收集了公眾對目標的意見。管理人員審查了這些意見，並作了必要的修改。目標於1999年6 月初確定。作為此程式lpi一級的一部分，目標被分開到101和 102號考試。本來，打算這些目標的大部分都只放入一個考試，但是很明顯，要測試所有的目標將超出it認證考試一般所允許的60-90。為了進一步與工業標準保持一致，這些目標被分到兩個考試。關於這一點，發行者和課件開發者能開始為lpi一級考試者製作培訓和教育材料。 7.目錄發展

隨著目標的確定，下一步就是寫出將在考試中出現的問題。（注意：在考試發展界中，一個問題被稱作一個目錄）不像其它主要發展階段中的步驟，目錄發展中的步驟是平行的。那就是，目錄進入以後，就從一個步驟流到另一步驟。安全是目錄發展中的主要焦點。所有目錄儘可能的保密是十分重要的。因此，參加這一步驟的每一個人都被要求不要向任何人泄露目錄內容，並簽訂不泄露協定。也採取了其它的安全防衛措施。

8.目錄編寫

大多數it認證考試目錄發展程式都是將一組主題專家集中到某一地點一個星期或更久，培訓他們如何編寫目錄，然後讓他們熱情地創建必要的目錄庫。由於花費巨大，及廣泛包含的願望，我們選擇不這樣為考試1 編寫目錄。而在1999年8 月在網上公開呼籲目錄編寫員。每一個有興趣和有知識的人都被鼓勵來編寫目錄。一個叫做tips的網路界面被用來收集大多數的目錄。目錄編寫者為每一目標編寫目錄。每一目標所需的目錄數是由它的目標重量值決定的。我們一收集到足夠覆蓋一目標的目錄時，我們就關閉這一目標，防止向這一目標提交更多的目錄。當這一目錄收集方法起作用時，我們有70 人提交了目錄以供考慮，大增長了這一階段。對於接下來的二級和三級，我們將象以前一樣提出公開界面，但同時也會尋找一組主題專家以更快地發展考試。

9.目錄篩選

一旦目錄被提出來，所有的目錄都要由考試發展管理者篩選，篩選集中在三個標準：

冗餘：與以前提出來的目錄很相同的目錄受到排斥。大體上講，目的是保證每一目錄都有不同的內容。
短語：那些用混淆的或不合適方法表達的目錄將被排斥或重述。同時也注意保證讓非英語母語的人也能理解
準確：管理者不是對所有linux領域都很專業，但是他們能反對或重述那些明顯技術性不準確的目錄。
在目錄篩選階段，每一個目錄：反對,完全接受，或重述後接受目錄技術審查，那些在篩選階段中被接受的目錄提交linux專家組作技術審查。我們與10名linux專家志願組簽了約，讓他們審查目錄。

在審查階段估價目錄的基本標準是：

正確性：審查者確保主要正確答案確實正確。
錯誤選擇的適當性（多項選擇目錄）：審查者確保錯誤選擇答案是錯誤的，而不是似是而非的。
短語：審查者確保目錄用合適的語言敘述。
與目標的相關性：審查者確保目標與它準備度量的目標緊密相關。
預見困難
每一目錄至少由兩名專家審查。每一個專家將每一個目錄分為：
同意,反對，或其它（審查者可能建議重述或者拒絕估價）。

考試發展管理者收集審查。
在這一階段，每個目錄：
一致同意接受：如果審查者認為目錄應該被接受，管理者一般都會接受它。
一致反對：如果審查者認為目錄應該被排斥，管理者一般都有會排斥它。
進一步審查後接受：如果審查者對某目錄達不成一致意見，管理者將在其它審查者的意見基礎上同意它。
進一步審查後反對：如果審查者對某一目錄達不成一致意見，管理者將在其它審查者的意見基礎上它，或者：
修改後接受：在某些情況下，審查者可能會建議重述某一目錄，管理者將在重述後接受它。

--------------------------------------------------------------------------------

10.創建考試
在所有目錄都被收集和審查後，下一步就是把目錄組裝成考試並廣泛地展開它。生動的創建形式首先，我們選擇那些包含每一目標的目錄，並把它們放到完整的測試形式。每一測試將有兩種版本。每種版本將由60-100個目錄組成，選自所有的測試目標。當一考生考試時，他或她將得到兩種版本中的一種。如果他們考試失敗而重考，他們將得到另一版本。（如果他們都失敗了，他們第三次將得到第一種版本）

注意：當考生考試時，考試中心將隨意安排題目。如果考試中心鄰座的兩名考生得到了同一版本，問題的安排仍然是隨意的，他們就不會按同樣的順序來閱卷。

11.前期考試公布 一旦lpi心理測驗學人員決定了版本成份，考試將由文本目錄形式轉換成實際考試檔案模式，通過測試中心網路將被廣泛地傳播。對這一點，我們使用在utah的galton technologies的服務。galton為很多的it認證程式提供這些服務。scott murry，lpi的考試開發主任，與galton一起工作，把我們的目錄變成所需要的形式。在最終產品交給之前，要進行幾級審查。在轉變之後，要取得考試檔案和做進一步工作，保證考試運行正常。最後，一級認證的兩個考試都有用。考試101於2000年1月11日，102於4月10日套用。

12.beta考試時期 考試現在進入了前期測試時期，最終目標是要決定題目是否正確運行和是否度量了它們要度量的技巧和能力。在測試行業中，這一時期經常叫做初始期，引導期或測試研究期。然而在it認證行業中，這一時期被稱作beta測試期。在這一時期，應試者能報考這些測試，並在本地測試中心完成它們。他們參加這些考試也得到信任。beta考試與最終考試不同之處在於，應試者不能馬上得到考試分數。事實上，在beta考試期間，所有的考試都是由lpi心理測試學人員親手閱卷的，並由郵寄傳送到應試者手上的。但是在考試得分送出之前，要設定評分標準。這本身就是一個複雜的程式。這時就有幾個同時運行的程式。

a.獲得足夠的考試設定評分標準的首要條件就是要獲得足夠的考試結果。目標是每一考試版本都有100份結果供設定。因此，由於我們每一考試有兩個版本，101和102都要有200份考試結果。我們公布了一個激勵的計畫，提供折扣，還使用linux business expo測試中心來獲得必要的考試結果。作為beta考試程式的一部分，我們也收集了參加考試的人的統計。（他們使用linux多久了？他們是否每天都進行系統管理？他們準備得怎么樣了？）我們希望有大量的與我們的目標工作描述相似的人來參加考試。當測試心理學人員在審查題目時，他們就考慮到了進行統計。

b.審查題目當考試結果出來時，測試心理學人員就開始檢查這些資料。有每個人都答對的問題嗎？有每個人都答錯的問題嗎？（這兩種情況都顯示了考試題目可能出錯了。）考生有什麼樣的意見？我們確實安裝了參考的人能發表意見的設備，就像你能從有較強意見的人（經常打字很快的人）那裡能得到的一樣，我們得到了大量的意見。真的，大量的意見。因此這一時期的部分工作就是檢閱這些意見，強調問題，增加關心。儘管有冗長的，全面的審查程式，還是有一些技術問題漏掉了，並出現在beta考試中。有一些題目需要丟棄。這些問題中的一些是考生提交的意見發現的。

c.修改了的-angoff調查當心理測試學人員在審查交來的資料時，一些獨立的由主題專家同時也在進行一個叫modified-angof的調查。它的目標是要為測試心理學人員提供附加的資料，以使問題有效和幫助設定評分標準。程式基本上是sme‘s接到每一考試版本的複本。他們檢查每一道題（獨立地和相互切磋），決定那些最小滿足說明中描述的要求的人，怎樣能正確回答問題。sme’s被要求從那些技能較差的人執行任務的觀點出發，來考慮問題。sme‘s用他們對有多少人能答對一道題的計算來估價題目，並且記住，在做多項選擇時，多少人單憑猜測就能答對。以下就是這一資料的用法。例如，有一問題，sme‘s的判斷比較強硬，他們認為考生只30%能答對。如果考試結果出來後有90%的考生答對了，那么就要檢查是否題目的答案被泄露了。（或者是答案出現在本考試中的其它題目中了。）相反地，如果有一問題sme‘s認為所有考生都知道，將有95%答對。而當考試結果出來後，只有10%的人答對了，那就要檢查目錄是否它的描述方法出錯了或是有一些其它的問題。理想地，angoff調查的結果應該與beta時期的考試結果有些相同。除了有效的目錄執行，angoff調查的結果同樣也被用來為考試建立評分標準。例如，打個比方說，angoff調查結果說所有的問題都太難了，某一版本的平均正確率為30%。這一信息告訴測試心理學家，他們應該把評分標準設得更低些，因為考試問題實在是太難了。

d.傳送得分結果在所有的資料收集，分析和angoff調查之後，測試心理學人員設定評分標準，並且為在beta 時期內進行的考試手動評分。然後用郵件把得分傳送給每一位考生。

13.考試發行 在beta時期所有工作之後，評分標準建立了，考試可以發行了。

14.考試再發行 隨著時間的推移, 每次考題更新, 以上一程式都會又包含了一次又一次的審查和重複，要一個月或更長才能完成。