張 艷
近年來,語言測試和評估的研究重點從技術層面轉向了社會和政策層面,即語言測試的社會聲音或社會話語,語言測試界也通過召開研討會、發行專刊對此做出了理論回應。①先前的語言測試研究關注測試效度和信度等技術層面的問題,而語言測試的社會性研究則更強調“測試的影響”,即從社會維度研究測試的使用、測試的作用和測試的公平性。②興起于20世紀70年代的語言測試道德研究就是這一新興領域的產物。語言測試道德包含一系列規范測試的標準,如測試公平性、測試結果的使用等。③2000~2009年,國際語言測試機構出臺了五部語言測試準則,對語言測試的道德性進行了規范和定義。雖然道德考量已成為國際語言測試的主流趨勢,但我國語言測試實踐對于測試道德的回應明顯不足。本文在系統梳理語言測試道德的理論脈絡和研究進展的基礎上,從國際比較的視野,對國內語言測試實踐進行道德反思。
測試道德研究的興起與測試界兩大理論密不可分。其一是Messick關于效度理論的拓展,其二是測試反撥效應(washback)理論研究向測試影響(impact)層面的轉變。1989年Messick擴展了效度理論,在分類效度觀和單一效度觀的基礎上提出了整體效度觀,強調構念效度的地位,并指出除構念效度這個核心觀念外,效度理念還應包含測試解釋和使用的科學基礎以及道德基礎。這一理念后被Messick用漸進矩陣模式展現出來(如表1所示)。……