網上人才測評的可信度

人才測評的信度與效度既是一個理論問題,又是一個技術套用科學性的指標問題。它是人才測評技術與套用的結合部,而且能對實際考試測評的質量提供保證。

我國人才測評技術的引進和開發在信度和效度方面反映出的問題,概括起來大致有以下幾個方面:一是信度、效度理論與有效套用問題主要涉及公務員錄用考試測驗的信度、效度指標、測評目標的模糊性和效度的解釋等問題;二是信度、效度的先導性與可操作性問題,涉及信度、效度與量表編制的關係,效度的可操作性等問題;三是效標效度的時效性問題,主要涉及預測度的準確性、同時效度的功能,預測效度與同時效度的分離狀況等問題。

信度(credibility)是指測驗結果的可靠性、穩定性,即測驗結果是否反映了被測者的穩定的、一貫性的真實特徵。這種可靠性體現在:

測驗結果跨時間的一致性――被測者在不同時間所測結果一致;

測驗內容的一致性――同一測驗內的各部分題目所測的是同一種行為或行為特徵;

不同評分者之間的一致性――不同評分者對同一測驗結果的評分一致。一項成熟的心理測驗都具有比較理想的信度。信度較低的測驗其測驗分數的穩定性較差,往往不能反映被測者的真實水平。

計算信度係數的公式和方法很多,通常有這么幾種:

(1)折半法。將測驗的項目分為兩部分,分別計算這兩部分的分數,以這兩部分分數的相關係數作為折半信度係數。這種方法簡單易行,省時省力。在把測驗的項目進行折半時,可以按奇項--偶項劃分,也可以按其它的標準折半。由這種方法得出的數值僅計算了測驗一半項目的信度係數,還要進行修正才能得出整個測驗的信度係數。

(2)複本法。複本是指研究人員同時編制兩份量表,它們在內容、形式、難度等方面等同,請被試分別接受兩次測驗,一次做一份,然後把被試的兩次測驗得分的相關係數作為複本信度係數。如果兩次測驗幾乎在同一個時間內完成,則該係數為複本係數,如果間隔的時間較長,則得出的相關係數為穩定或等值係數。這種方法得出的結果比較能說明問題,但是要編制兩份等同的量表殊非易事,因此在實踐中的套用受到一定的限制。

(3)重測法。若編制兩個量表有困難,可以用一個量表對同一個樣本實測兩次,由之得出兩組分數的相關係數可以作為重測信度係數。這種方法往往容易引起被試的反感,覺得乏味,不願意配合;此外樣本的構成,兩次測量的間隔,欲測構念的穩定程度也會影響到測量結果。

(4)內部一致性考驗法。這種方法近來很為流行,它可以從信度和效度兩方面說明問題。這種方法從信度與效度的關係角度提出了對測驗量表內部一致性考驗的思路,如果一個測量量表是有效的,這個量表就必須是前後一致的。每個量表的不同層次都應該指向構念的方向,不同的測量項目應該涵蓋所欲測量的構念的一部分,為測量作出各自的貢獻。如果一個量表中的所有項目都是高度內部一致性的話,那么整個量表僅能測量構念的某個部分,而不是其全部。用這種方法不僅可以衡量整個量表的信度係數,而且可以從項目的水平分析其作出的貢獻。

效度是另一個衡量心理測量質量的指標。效度(validity)是指所測量到的結果反映所想要考察內容的程度。信度是效度的必要條件,但並不充分,效度要進一步解釋經驗水平的指標與理論構念的聯繫。測量結果與要考察的內容越吻合則效度越高;反之,則效度越低。總之,某些測試對所要測量的行為具有更明顯的代表性;而有些則相反。正因為如此,我們很難證明一項測試測量到了希望測量的東西,即證明這項測試是有效的。可以把效度大體上分為兩大類:一類是經驗效度,這是比較普遍的一類,它們主要表征一些可觀測變數間的關聯程度,因此,這類效度通過分析兩個或兩個以上變數間的關係,可以用一些觀測變數預測另外一些觀測變數;另一類效度是理論效度,它主要表征觀測變數與理論構念間的關係,這些理論構念往往是潛在變數,不可直接觀測。