宋孜宇 唐琦
信號檢測理論(SDT)應用于評估中心(AC)法初探
宋孜宇 唐琦
(呼倫貝爾學院經濟管理學院 內蒙古 海拉爾 021008)
本文介紹信號檢測理論的原理,進而從理論上探討了引入信號檢測理論改進評估中心評估效度的主要原理和方法,為提高評估中心法的評估效力提供了理論參考。
評估中心法;信號檢測理論;績效
在人力資源招聘決策中,需要對參加應聘的人員進行各種評估以決定取舍,但是各種評估方法的可靠性(信度)不同,成為直接影響招聘決策質量的主要問題。為了解決這一問題,評估中心(assessmentcentre,AC)流程評估法誕生了幾十年并一直倍受關注,因為這種評估方法可以相對靈活的進行定制化評估,盡管評估中心法通常表現出較低的建構效度,但并不影響這一方法的廣泛采用,很多學者認為這是評估工具經常存在的測量不充分而導致的問題。
目前,國外一些學者提出引入心理物理(Psychophysical)領域的信號檢測理論(Signal Detection Theory,簡稱SDT)來嘗試進一步提高評估的信度。盡管SDT理論早已被心理認知等領域的研究所熟知,但是該理論在AC評估者的績效評估領域依然應用不足,這是一個有待開發的新范式,將有助于進一步提高評估中心流程評價法的建構效度。本文將在SDT理論研究的基礎上,簡單探討如何引入SDT方法應用于AC評估人員的績效評估。
信號檢測理論(Signal Detection Theory,簡稱SDT)是現代信息理論的一個重要分支,其研究對象是信息傳遞過程中的信號接收問題,主要應用于通信工程領域中。在SDT的表達體系中,某種有待檢測的項目或者目標被稱為“信號”。而任何不是信號但可能對信號造成潛在干擾的信息都被歸為“噪音”。這一理論早可以追溯到二戰時期,當時被應用于微弱的聲納信號或雷達信號檢測統計決策理論。1954年,美國密西根大學的學者首次將SDT理論引入了心理學,用于研究知覺、記憶、思維以及個性等領域,把心理物理學的研究推進了一大步。
簡而言之,信號檢測理論是以概率論為基礎,把對刺激的判斷看成是對信號的偵查和做出選擇的過程。在心理學研究中,可以將人的感覺以及神經系統的分析判斷過程視為一個信息加工的過程,并將刺激變量作為信號,將刺激的各種物理性的或個體性的隨機變化作為噪聲,于是將人的感覺判斷過程簡化為噪聲背景下的信號檢測問題。這一過程包含兩個關鍵指標,一個是辨別力指標,用來指示人的感受性,這一指標主要取決于個體的感覺辨別力,取值越大則表明感受性越強;另一個關鍵指標是反應偏向,與判斷標準有關,并受利得利失、動機、態度、經驗等因素影響,取值越大表明判斷標準越嚴苛。
具體應用信號檢測理論時包括兩種實驗方法或模式,分別是有無法(yes-no method)和評價法(confidence method)。有無法的具體操作是先在一定的噪聲背景中給予或不給予信號刺激,同時記錄下被試者所做出的信號“有”或“無”的判斷及其正誤,以此計算出其命中或誤報的概率,再將概率值帶入標準公式即可算出被試者的辨別力指標和反應傾向指標。而評價法是要求被試者在做出信號有無判斷的同時,報告自己做出判斷的把握程度,即信心指數,比如做“有”判斷時有70%的把握判斷正確,從而更精確的評估被試者在不同判斷傾向下的辨別力。
SDT理論主要關注各種事件在觀察者大腦中所形成的印象,而這種印象正是進行決策判斷所需要的。當個體進行決策判斷時,其頭腦會高效的分辨出這種瞬時產生的認知是來自于背景噪聲中的信號,或僅僅是一個噪聲樣本。評估者所感知的各種證據在多大程度上能夠成為明確的決策信號,主要取決于對以往內部印象的分布如何進行采樣,這種分布在性質上通常被假定為高斯分布(Macmillan &Creelman, 2005)。而來自信號事件的內部印象的平均強度被假定為高于單獨來自于噪聲的內部印象。噪聲加噪聲的分布與噪聲加信號的分布可能相同,也可能不同。這種測評方法所具有的靈敏性提供了有效的指標以區分這兩種分布的性質。但如果兩種分布之間存在一些重疊,那么總體的準確性將不可預期。
Macmillan等(2005)深入探討了SDT理論應用的各種模型,Harvey(1992)認為如果能夠將這些模型應用到評估中心情境中,把評估專家所進行的各種人才分類作為信號來處理以計算其相似度或可能性,將幫助評估中心法取得更為可靠的結論。這些模型所提供的信息和結論將提供不同方面的建議,比如是否要提高評估專家的辨別力,或者調整評估專家的反應傾向等。當信號檢測方法被應用于人員績效領域時,它可以量化評估者判斷決策的靈敏度或辨別力。同時為了應用該理論,觀察對象必須能夠按照信號或噪聲的判斷標準進行分類。
評估中心的評估人員所要面對的求職者往往提供多種資料以證明他們對組織的適用性,但他們只有經過事后的工作考驗才能被證明與組織的要求是否匹配。在這種情況下,前面提及的與評估人員績效有關的兩個方面就變得尤為重要。首先是通過申請人提交的證據材料判斷其適用性的辨別力,這是一種能夠區分候選人適合與否的潛在能力。第二個方面是基于所有可感知的證據而進行相機決策的能力。在現實情境中,即使兩個鑒別力相同的評估人員面對同一申請人展現出的相同特質,仍然可能會對這些特質是否足以確定一個特定的評估分數而意見相左。因此,在評價評估人員的績效時就需要一些客觀的測評工具,不但能夠測量他們看法的準確性,更重要的是能夠明確地測量他們的評價標準相對于其他評估者或者評估中心的目標,是趨向于更加嚴格還是更加寬松。這些方面的績效測評正是信號檢測理論范式所能夠實現的。
如果用于決策的判斷信息數量充足,那么測評方法的辨別力和偏向性都能夠通過信號的呈現和正確判斷的概率而得以揭示,這時可以稱之為“命中”(hits)。如果觀察者報告了信號的呈現,但是實際并沒有信號的呈現,這種情境稱之為“誤報”(falsealarms)。命中和誤報的情境都是用來估計測評方法的鑒別力和偏差的樣本。在報告一個信號的出現之前,命中和誤報的比例會隨著觀察者所需證據的逐漸增加而規律變化。在一個給定的辨別率水平下,用圖形來表示所有命中與誤報可能的比例組合,將形成一個連續曲線,該曲線被稱之為(信息)接收者工作特征曲線(receiver operating characteristiccurve,ROC)。ROC曲線族的分布范圍從位于正對角線上的零值辨別率開始,隨著辨別率值的增加呈現出一個朝向左上角拱起的曲線,并占據一個單位正方形從而形成ROC空間。如果記錄的測評分數反映了信號存在的必然程度,那么將會得到ROC曲線上的若干點,然后就可以通過計算機分析來確定最佳擬合模型的參數。于是,根據特定數據在最佳擬合ROC曲線上的位置就可以用來表示觀察者的反應偏差(見圖1)。

圖1 接收者工作特征曲線圖
ROC曲線來自于評估人員對應試者所提供信息的判斷數據資料。位于圖形主對角線上的虛線代表零辨別力,而位于負對角線上的虛線代表無偏反應(辨別力),圖中的實線則代表最佳擬合某被試者辨別力數據的辨別力曲線,該曲線與無偏反應曲線的距離一目了然的反應了該評估人員對面試者提供資料的辨別力水平。
具體而言,可以分三個步驟來實現對評估中心評估員的辨別力和反應傾向進行區分。首先,在一個評估中心中,針對某一個具體評估項目,比如申請某零售業管理人員的候選人選拔項目,候選人被要求參加若干測試項目,并由一組評估者進行打分,詳細記錄這些評估者對每一個候選人的評分以及綜合評估。這時,每一項需要打分的活動都有可能成為一個信號事件或者噪聲事件,而判斷的標準取決于這名候選人最后是否被評估小組確定為合格人選。于是,當評估小組最終決定某個候選人應當被錄取時,即評估小組假定此人適合企業的需要,那么這名候選人按照信號檢測理論就成為了一個信號,而其他落選的候選人則被指定為噪聲。
其次,為了區分評估者的辨別力和反應傾向的差異,用評估者所做出的所有評分構建評估組及評估者個人的ROC曲線,以此得出關鍵參數值。此時,需要選擇信號檢測模型來進行模型擬合分析,并在模型擬合程序中設定噪聲分布的標準差為1,同時設定信號與噪聲的比例分布為自由變化。異方差假設的合理性可由信號與噪聲比例分布的標準誤來確定,而信號與噪聲比例的分布取自最佳擬合的ROC曲線,最后通過極大似然法從ROC曲線中可以得到各個參數的估計值。這些參數值包括了每一個評估者的辨別力參數、反應傾向性參數以及可信度參數,從而實現了對同一組評估組中的每個評估者之間差異的準確把握。
最后,根據所掌握的各個評估者的辨別力和反應傾向性參數值調整評估組的成員構成,以提高評估組整體的評估能力和有效性。很顯然,評估者的辨別力參數值和反應傾向參數值越高越好,這說明該評估者有較強的辨別力以及與評估組整體更為一致的辨別傾向性,采用這樣的評估者構成評估組將會有更好的評估績效。同時,對于辨別力參數值和反應傾向性參數值較低或不均衡的評估者,可以根據具體的取值情況進行有針對性的培訓,以提高其辨別力和均衡的辨別反應傾向性。
本論文從評估中心法建構效度的不足和信號檢測理論的基本原理出發進行探索性思考,提出可以引入信號檢測理論,構建一個信息接收者工作特征曲線(ROC)圖,用以區分不同的評估者對候選人材料的評估能力或辨別能力,進而有效調整和改進評估小組成員評估能力,提高整體評估有效性的方法。盡管本論文所構思的探索性方法在本論文并未進行驗證,但是所提出理論來自于成熟的心理物理領域,所提供的操作方法也比較具體可行,因此對人才測評領域的研究也具有一定的理論價值和實踐意義,對評估中心測評方法領域的研究也起到了拋磚引玉的作用。
[1]陳曉惠.心理學研究中信號檢測論實驗綜述[J].教育教學論壇,2013(10):16-18.
[2]陳舒永,馬謀超.信號檢測理論與古典的心理物理學方法[J].心理學報,1979(03):331-335.
[3]范巍,謝小云.評價中心法的幾個經典誤差:人才選拔效度的視角[J].第一資源,2008(01):91-99.
[4]HarveyL. O. The critical operating characteristic and the evaluation of expertjudgment[J]. Organizational Behaviour and Human Decision Processes,1992(53), 229–251.
[5]MacmillanN. A., Creelman C. D.Detection theory: A user’s guide (2nd ed.). Mahwah,2005,NJ: Lawrence Erlbaum
責任編輯:王靜
2017-06-17
宋孜宇(1978-),男,漢族,呼倫貝爾學院經濟管理學院講師,碩士,首都經濟與貿易大學在讀博士生。研究方向:人力資源管理。
唐琦(1983-),呼倫貝爾學院經濟管理學院講師,碩士。研究方向:營銷管理。
F243.2
A
1009-4601(2017)06-0052-03