選才實務運用 – 測驗類別及應用系列之七：測驗可信嗎？

【本文作者：全人多元智慧發展研究中心研發顧問蔡曉風 / 葉昶志】

在前六期電子報當中，我們介紹了六種常見的人事甄選工具。不同甄選工具有其特有的優點，但也有其應用上的限制。當人資主管們在費心挑選測驗工具時，最關心的莫過於測驗結果『可不可靠』、『有沒有效』。而測驗工具是否『可靠』、『具有效果』，是兩個不同層次的問題。在人事甄選中，我們不希望看到同一位應徵者今天測的結果和明天測的結果相差甚遠，因為人的反應行為具有一定的穩定性；我們也不希望明明是選用「工作態度」測驗，測到的卻是「工作興趣」。前者，關注的是測驗「信度」，而後者關注的是測驗「效度」。本期電子報我們將介紹常見的測驗信度指標。

信度(Reliability)指標

（1）何謂信度？

顧名思義，測驗的「可信」程度。以磅秤來舉例說明，正常來說一位成人的體重，今天和明天用同一磅秤量結果應該是相當接近的，如果差很多，我們便可合理推論磅秤故障、測量結果不可信。而心理測驗就如同那個磅秤，我們相信人的特質在短時間內不會快速改變，如果在短時間內同一個人被測出的結果很不一致，就表示測驗結果很不穩定，不具信度。

（2）常用的信度種類

信度依據所關心的穩定性種類不同而分為下列幾種：

（A）	『複本信度』：例如，測量同一位應徵者的英文能力，英文測驗分為A、 B兩種卷別。若同一位應應者在兩個卷別的分數一致性越高，則表示測驗的複本信度越好。通常在人事甄選中，若公司欲使用兩種卷別以上的英文測驗，就必須關注各卷別之間複本信度。

（B）	『內部一致性信度』：例如，應徵者在同一份測驗中，面對A、B兩題同樣在測量『人際溝通』的題目，應徵者所呈現出來的A、B兩題的作答反應，正常來說，應具有相當高的一致性程度，則測驗具有良好的內部一致性。

（C）	『再測信度』：例如，有位應徵者，來公司應徵兩次，相同的測驗也做了兩次，假設應徵者是誠實作答的狀況下，相隔一段時間之後，前後兩次的測驗結果，若具有相當高的分數一致性，則測驗具有良好的再測信度。

（D）	『評分者間信度』：例如，面試同一位應徵者，兩位以上的面試官同時對這一位應徵者進行面試審核，假設面試官都是公正客觀的狀況下進行評分，若面試官們的評分越一致，表示面試官之間的評分越具有『評分者間信度』。

通常人事甄選測驗『Ex：態度類型測驗』多半都會註明，測驗的內部一致性信度α值，表示同一位受測者在同一份測驗不同題目上反應的一致性。α信度係數介於0~1之間，數值越接近1表示信度越高。但是，隨著測驗題目增加，內部一致性信度係數α也會提高，故請小心落入數字迷思。

實戰問題Q＆A

多高的信度才合理的？

視不同類型的測驗而定，沒有絕對的數值，通常題數愈多信度係數也愈高。一般而言，以評分者間信度為信度係數的上限，而複本再測信度為信度係數的下限。以情境判斷測驗(SJT)為例， Cronbach’s α 為0.4~0.7之間，屬於中等的信度。因為特別設計工作情境，又作答採排序方式，且目的在於「篩選」可能之目標，故該數值可以被接受。同樣的標準若放在智力、英文等測驗上，就顯得不理想。

信度和效度有什麼差別？

測驗就好比是射箭比賽，假如今天比賽場地上的風向固定往某一個方向吹，使得箭枝固定集中偏移到外圈某處，雖然每一支射中標靶的地方都差不多（如圖一所示），卻不是選手想要的。這就是有信度(結果都很穩定)而無效度；如果箭枝穩定的射中紅心，就是有信度且有效度。

本期電子報，我們介紹測驗工具中常見的信度指標類型，下一期電子報將針對『測驗工具中常見的效度指標』進行介紹。

參考資料：
1.葛樹人，2001，心理測驗學。桂冠。137-199。

想得知更多人資及測評的相關知識
請進入『全人』部落格:

人力資源管理的新視界