● 谷向東
中國是考試的發源地,一直沿襲著考試的傳統做法。直到90年代后期,西方的人才測評技術才逐漸由外企引入中國,理論研究與方法建設非常欠缺,相對于不斷引進的大量西方測評技術,理論與方法的本土化研究幾乎是空白。 目前國內的選聘工作都或多或少吸收了西方的思想和做法,但我們的主流選聘實踐的核心理念和技術仍然是考試,中國考官的評分仍有濃重的考試色彩。
那么,發源于中國的考試與發源于西方的測評有什么區別呢?簡單的說,考試的理論基礎是"擇優汰劣"和"干什么,考什么";考試主要依據崗位職責要求和雙向細目表進行命題,采用的核心技術是申論、客觀題、案例分析和面試等,評價者多是單位領導和某個專業領域中的資深專家,測試的結果主要是按照分數進行排序,其作用主要體現在人才招聘與選拔上。而人才測評的理論基礎是人職匹配,測評主要依據勝任力模型設計測評方案和命制題目,采用的核心技術是以情景模擬為主的評價中心技術,評價者多是人才測評的專業人士,測試結果的呈現方式主要是素質測評報告,其作用主要體現在選拔、培訓、發展、指導。為此,本文試圖從中西方的對比研究中進行分析,為本土化研究提供借鑒,為中西考試測評技術的進一步有效融合探索有效途徑。
西方的人才測評一般界定為一個收集和評估有關候選人信息的過程,以便做出針對某職位的人事決策。長期以來,人們主要采用收集學業成績和工作資歷作為評價內容,直到二戰后才開始采用智力測驗和個性測驗的結果進行人事決策。實踐證明,這些信息至少難以預測復雜工作和高層次職位任職者的工作績效或生活中的成功。
近年來,西方新增加的評價內容主要有情緒智力(EI)、實踐智力和勝任力等。美國耶魯大學的心理學家Sternberg研究發現實踐智力是管理績效非常好的預測指標,后又提出實踐智力構成勝任力的核心,從而將實踐智力與勝任力概念融合到一起。情緒智商的概念是由美國心理學家Salovey和Mayer提出的,用于描述對成功至關重要的情緒特征,后來又推出情緒勝任特征的概念,也實現了與勝任力概念的融合。西方人才測評領域得到普遍接受和廣泛應用的主流評價內容為麥克利蘭德勝任力,圍繞勝任力的一整套技術方法為人才測評提供了很好的評價基礎。
對于勝任力,目前西方所采用的主流測評技術是基于多質多法的評價中心技術,測評的原理是人職匹配。為了建立科學的評價內容,首先要通過工作分析建立相應的勝任力模型,并且界定行為的操作定義,使之可被準確觀察、記錄和評價。如將“組織能力”定義為“在小組討論中既能主動發言,又能顧全他人,組織大家發言,及時向他人提出疑問,及時糾正跑題,發言能綜合他人意見,適時概括、總結別人的發言?!比缓?,將各種評價方法得出的評分進行整合,得到一個“組織能力”的最終分數。最后將該分數和其他勝任力得分與崗位勝任力模型比照,得出總體的人職匹配水平,以此作為人事決策的主要依據。
而對于那些抽象的勝任力如責任心、敬業精神等,則必須進一步分解和操作化,才可以采用測評技術進行測試。西方認為情景模擬測試難以測試出品德、個性等深層次勝任力的內容,需要通過心理測驗、工作考核、背景調查等手段進行了解。更重要的是,被測者在實際工作環境中的品德行為必須依靠法律、工作制度和激勵方法加以規范和保證,并在實際工作中對其長期考察,僅靠短時間的評價中心是很難解決這一問題的。
在測評中,西方考官對于被測者觀察評價的主要方法是行為報告法。這種方法強調先觀察、記錄被測者的行為信息,而不是直接對被測者的行為表現進行打分。具體分為以下幾個步驟:
(1)觀察行為(Observing):考官在測試過程中全面而有重點地看與聽被測者的行為細節,包括語言、語氣、動作等。
(2)記錄行為(Recording):考官在觀察的同時,采用速記法盡量全面地進行記錄。
(3)將行為按照測評指標歸類(Classifying):在觀察和記錄行為后,考官將被測者的大量行為細節歸類和劃分到對應的測評指標上。例如“在充分肯定別人之后,對大家說出了自己的相反意見”可以劃分到“影響力”這一測評指標中等。
(4)初步對測評指標打分(Evaluating):考官在將行為歸類完成后,對每名被測者的行為表現情況嚴格比照每個測評指標的描述情況,按照“吻合率”或者“一致水平”給出一個初步的分數。比如,符合率為80%,按照十分制評分就可以給8分。
(5)整合分數:考官圍繞每個勝任力指標的評分進行討論,每一名考官都針對同一名被測者的同一個指標給出自己觀察到的行為和評分,各考官之間的觀察行為報告可以相互補充、印證,不同考官的不同評分可以通過討論達成一致。在上述工作的基礎上形成整合性的評分結果和完整的測評報告。
在面試、小組討論等測試中,考官工作的原則和具體的任務是觀察和記錄候選人所有重要的行為和語言,在觀察中要保持高度集中和注意;對所有的候選人都保持公正公平,排除主觀印象;注重行為事實,而非主觀感受;在測試中,不進行任何主觀的推理,直到測試結束后才做出判斷;所給出的具體評價分數要有足夠事實作為支撐,加以佐證;要充分克服各種誤區,比如第一印象、近因性、暈輪效應和刻板印象等。
考官思維加工的關鍵原則是客觀性原則,在觀察階段僅僅關注事實,即那些看得到的和聽得到的內容,不可以摻雜主觀推測和判斷的成份。用一個不太恰當的比喻,考官在觀察記錄階段需要表現得像一臺攝像機,而在評分階段則可以進行一些歸納概括判斷,但仍然必須保持充分的客觀性。
中國有著悠久獨特的中華文化,人才的評價與選拔標準自然有自己獨特之處。歷史上許多大師級的專家學者對于選人的標準和方法都進行了深入的論述。概括起來,他們非常重視對抽象的個性、品德等內容的考查。比如,《易經》中提到領導應具有定力、情懷和效率等品質;《尚書》提出了“九德”概念;儒家提出選人的標準為節用愛人、以身作則、樂觀積極、剛直不阿、謙虛踏實、理性求實、文質彬彬。墨家則提出厚德載物,認為在形成領導者品質的各要素中,道德品質占據很重要的位置,并提出“德”的十一項指標。上述種種流派的理念代代相傳,沿襲至今,構成中國觀察和評價人的內在標準。
2005年,筆者開展了一項“處級正職內隱的領導素質結構初探”的研究,對60位特大城區的黨政處級正職領導進行訪談調查,經過質性研究概括出20個素質條目,其中的核心部分包括品行正直、奉獻精神、事業心、政治素質、服務意識等品德的內容,另外還包括許多個性內容,這些素質的被提及率都比較高。這證明了對領導者評價的內在標準十分強調品德和個性成份,說明考官在實際觀察和評價的思維加工中會下意識地將這些素質內容納入到評分標準中。
中國人的個性框架結構也有較強的獨特性。近年,臺灣學者楊國樞和北大的王登峰教授所開展的中西方人格結構的比較研究表明,與西方的大五人格不同的是中國人存在大七人格結構。雖然在“外向性”和“情緒穩定性”上中西方有著較高一致性,但從內容上看,西方人的這兩個維度主要反映外在行為的特點和傾向性,而中國人則較多涉及個人品質。另外,中國人獨有的人格維度包括 “精明干練——愚蠢懦弱”,指的是能力;“善良仁慈——狡詐卑鄙”,指的是道德品質;以及“淡泊知足——功利虛榮”,指的是一個人所追求的目標。這三個維度,都是中國人評價自己及他人人格的重要維度。
今天,人們在選人用人實踐中已經或多或少引進西方的測評標準的理念與技術,對綜合分析、組織協調等行為化的素質進行測試,但仍然非常重視品德和個性因素的考察。以面試為例,在正式的面試實踐中,考官通常仍然十分重視責任心、謙遜、有魄力和進取心等個性和品德的內容內容的觀察與評價。具體表現為:考官們尤其是領導考官在評分討論和決策討論中頻繁使用上述有關個性和品德的用語,同時使用許多相關的推測性語言,并強調這些因素的重要性,賦予其很高的權重等。筆者認為,這樣做抓住了選人評價的關鍵要素,問題是如何才能實現對這些要素的準確測評。
概括說來,中國考官觀察評分方法有三個突出特點,一是傾向于非結構化面試的方法,“中國選才調查”2010年出爐的調查數據表明,英國在招聘選拔中采用結構化面試的比例為69%,中國僅為38%;而中國在選任中普遍采用面試的方法,說明存在大量非結構化面試實踐。二是具有濃厚的考試色彩,表現為多數面試等測試的目標僅僅為了給候選人排出名次。三是評價中強調個性、品德等內容勝任力標準,而這些標準往往有較強的概括性、抽象性,缺乏操作化和量化標準,更多需要依靠觀察者的經驗、悟性和直覺進行評價。
中國考官的評價程序是首先提出問題,引發被測者的言語與行為反應;其次,觀察被測者的言行,憑借記憶進行“記錄”;最后,概括性地進行思考加工,調用經驗儲備,比照評分標準,給出分數。這種方法的優點在于充分發揮考官的能力,為最大程度地深挖被測者信息提供了可能,不受評價標準的限制。但是整個過程由于操作性不強,考官沒有進行詳細記錄,往往憑借記憶比照概括性的評價標準進行量化,因而比較模糊。評分是“仁者見仁,智者見智”的過程,考官的主觀性難以控制,也就造成了對同樣的被測者,不同考官的評分出現較大差異而且難以調和的情況。這種評分方法對于有些考官故意操縱分數、打出極端分數、給出不穩定不恰當的分數等等問題都沒有很好的處理辦法。實際操作中往往采用七位以上的考官同時觀察評分,對于考官之間的評分差異問題要通過計算平均值的方法加以解決。
經過大量實踐和反思,中國形成了觀察評價人才的獨特視角、思維模式和評價方法,并以非常概括性的語言加以描述,代代相傳,但是實際掌握應用需要具有很好的悟性、長年的閱人用人的經驗,并且善于反思、歸納、總結,這對于一般考官尤其是年輕考官是有相當挑戰性的。
考官必須借助主觀能動性進行推測,正如《淮南子》所主張的考察人才要注重行為的細小方面,然后推知總體品行??脊偃魶]有很好的悟性和經驗,做到這一點是很困難的,所以這種做法很難復制推廣。
筆者認為兩種模式各有特點和利弊,根據各自特點可將中國的主流評分方法定義為概括經驗法,將西方的主流評分方法定義為機械評分法。
西方評分方法是更強調客觀性,最大限度排除了主觀成份的影響,而且易于掌握和大面積推廣復制,對于評分人員的領導經驗和觀察人員的天賦等要求不高。但是西方的評分法比較機械,內在的邏輯是加減乘除,采用的是“具體行為點”歸納出“內在勝任力”,是 1+1+1=3的思維,而由于割裂的行為細節相加未必準確推導勝任素質水平,因而可以說它在一定程度上忽略行為整體的復雜性,造成了“只見樹木,不見森林”、“不識廬山真面目,只緣身在此山中”。而且這種方法比較繁瑣,費時費力。
而中方則將事物聯系起來,形成一個整體,借助有經驗觀察者的慧眼,站在一個更高的層面俯視地進行觀察評價。這種方法淡化細節內容,重視整體的概括評價和直覺的判斷,解決了“在對人的評價中細節成份的簡單相加推測出綜合因素未必合理”,即“1+1+1未必等于3”的問題。這種方法對于考官要求很高,在公開選拔和競爭上崗測試中,挑選考官往往只能選擇那些相應行業或者專業領域的成功人士和高管,合格的考官難覓且所需成本很高,難以進行大面積推廣,而且更重要的是它為主觀性打開了大門。
總之,兩種方法各有利弊,難以替代,應該相互融合。
目前,中國在考評工作中,考官往往由臨時抽調的非測評專業人員構成,可以稱為“臨時考官”,多是以本地組織、人事、紀檢監察等部門和用人單位的領導為主;評分基本依賴于參照擬定的標準答案,或者根據直覺進行評價,沒有足夠的專業測評技能評判出被測者的各種素質能力水平。有鑒于此,我們在實際操作中,要側重注意充分吸納西方重客觀、重量化的思想與操作化強的評估技術,借此提高這些"臨時考官"的專業技能水平,盡量減少評分中的人為主觀成分,提高我們評分的科學性與嚴謹性,同時充分保留中方評價方法的精髓,從而形成科學高效的綜合方案。
筆者認為有兩種具體的操作方案:
方案一是,對于“臨時考官”開展至少1-2天的西方評分方法的訓練,使他們同時掌握兩種評分方法的技巧,在分要素的評估時采用西式方法,在綜合評估時,采用中式方法。即采用西方的方法得出每個要素項分后,可以將所有要素分相加得到一個總分,這個總分與采用中方方法得到的總分往往會有一定的差異,這正是前述的評價標準和視角不同所致,最后的總分可以采用數理統計的方法加以合成,將兩個分數按照一定比例或者權重進行加權,比如按照7:3的比例合成。
這種方法的操作難點在于讓考官們掌握西方的評分方法,為了幫助他們快速習得西方的評估方法,可在評分表的設計上下功夫。具體可以對每個評價要素采用行為列表法,給評價人員提供行為觀察上的幫助,在行為列表上對每一維度進行操作化界定,至少列出10種左右的典型行為,尤其是一些關鍵性的行為,同時最好將列表上的行為按照實際發生的類別進行分類,這樣就可以幫助他們在缺乏系統訓練的前提下快速掌握西方的評分方法。
方案二是,考官組由兩部分人構成,一部分為專業的人才測評師,另一部分為所謂“臨時考官”。對于前者,要確保人才測評師熟練準確掌握西方專業化的評分方法,以提高評價的客觀性。對于“臨時考官”,盡量選擇那些在選人和用人方面有豐富經驗的領導和人事專家,他們對人的觀察、評估與分析上是“行家里手”,可以熟練高超地運用中國式的評分方法。每位被測者的最后得分可以將兩類考官的評分按照一定權重進行合成,形成最后的得分。
為此,今后應進一步加大專業人才測評師的培養力度,以滿足社會迅速增長的對專業測評師的需求,不斷增加專業人才測評師在考官組中的構成比例,至少達到半數以上的水平。另外,在測評方案的設計上也要按照評價中心的設計原則進行,比如,要進行科學詳細的工作分析以建立崗位的素質模型作為評價的基礎和標準,對所有評價人員進行科學選擇和專業化的深入培訓,采用多個評價者,對于同一個素質采用多種測評手段進行測評。只有在評價的方式方法上不斷完善,才可以最終實現科學的測評,切實提高考試測評水平。
1.北京雙高人才發展中心:《領導人才選拔研究與實踐》,北京出版集團公司北京出版社,2009年版。
2.陳德述:《儒家管理思想論》,中國國際廣播出版社,2008年版。
3.王登峰、崔紅:《中國人人格量表(QZPS)的編制過程和初步結果》,載《心理學報》,2003年第35期。
4.Zeidner,M.,Matthews,G.,Roberts,R.D.Emotional intelligence in theworkplace:acriticalreview.Applied Psychology:An International Review,2004,53:371-399.
5.Terpak,Michael A..:Assessment center strategy and tactics.PennWell,2008.