屠煜
【摘要】漢語成績測試的編制既要反映它的診斷目的,也要遵循語言測試的一般原則,這就是重視試卷的信度和效度,它們是漢語成績測試質量評估和檢驗的指標。文本通過闡述漢語成績測試的信度、效度以及二者之間的關系,說明如何提高漢語成績測試的質量。
【關鍵詞】漢語成績測試信度效度
【中圖分類號】G642【文獻標識碼】A 【文章編號】2095-3089(2014)2-0042-02
一、信度
信度即測試結果的可信程度,又稱為可靠性和穩定性(劉潤清、韓寶成,2000)。亦即測量結果是否真實、客觀的反映實際水平,如果用某套試題對同一應試者先后進行兩次測試,結果第一次得85分,第二次得45分,結果的可靠性即信度就值得懷疑了。對成績測試來說,試卷的穩定性除了可以保證達到同一分數線的測試對象具有基本相同的水平以外,還可以反映教學的變化情況,如果這一屆學生的成績比上一屆普遍提高了,就說明教學質量提高了;如果這-屆學生的成績比上一屆普遍降低了,就說明教學質量降低了。
那么怎么知道一個漢語成績測試的信度情況呢?
(一)檢驗信度的方法
1.再測法:這種方法是用同一套漢語成績測試試卷給同一批漢語學習者考兩次,比較兩次的漢語成績測試結果,求出相關系數。
2.復本法:根據復本考試結果的得分情況來計算二者之間的相關系數,就可以判斷漢語成績測試的復本信度。
(二)提高信度的方法
1.適當增加測試題目的數量:數量多則代表性就大,學生就不會說出這樣的話"老師,我會的你都沒出",既能提高信度,又可提高效度。但數量太多又操作困難,引起漢語考生的疲勞和反感,所以反而降低測試的可靠性。所以命題者應該尋找一個合適的量,確定合適的題量。
2.測試的難度要適中:難度適中,則信度大,區分度也大。
3.測試的程序應統一:測驗的過程直接關系到信度的高低,信度需要規范公平的測驗過程去保證。
4.測試的時間要充分:測驗的時間如果不足,不能客觀反映學生的實際水平,也影響信度。
5.評分要盡量客觀、準確:評分不準確,必然降低信度。
二、效度
效度是指測量結果的準確性和有效性的程度,亦即測量是否達到了預期的目的。換句話說,也就是測量是否精確地測量了想要測的東西,即測試結果與測試目標的符合程度。
例如,如果要全面測量閱讀理解能力,就必須設計含有有關的漢字、詞匯、語法、文化、語用等方面的知識的綜合性閱讀試題,而不應當設計只含有某一兩個方面的知識的分立式試題。閱讀理解必須有-定的速度,因此卷面的長度必須與測試的時間相一致,如果卷面太短,就測不出閱讀速度。又如,測量閱讀理解能力只能設計測量閱讀能力的單項卷面,如果試卷上既有閱讀方面的試題,又有寫作方面的試題,就不能精確地測量出閱讀理解能力。閱讀理解既需要一定的語言知識,又需要一定的文化知識,如果文化知識太專,超過了多數測試對象的知識范圍,也達不到測試目的,因為難以判斷是語言能力方面的問題,還是文化能力方面的問題。
可以從以下三個方面理解效度:
1.一般而言,判斷效度的高低,就是判斷測驗達到目的的程度。
2.測量結果真實、正確的反映被測對象的水平,則為效度較高或有效。
3.效度只是高與低的問題。
(一)效度的類型
在語言測試領域,根據漢語教師的客觀情況和實際需要,主要討論三種效度:內容效度、表面效度、結構效度。
1.內容效度:是指漢語測試樣本體現整體的程度,也就是測量內容的代表性程度。
2.表面效度:是指審題者個人,依據自己的漢語教學經驗和漢語理論修養以及對漢語成績測試的理解,對該漢語成績測試的有效程度的評估。
3.結構效度:是指成績測試在多大程度上與語言學、第二語言學習和第二語言教學等理論相一致。
(二)提高效度的方法
1.精心編制題目和試卷:題目難易度、區分度要恰當,數量要適中。
2.嚴密組織和安排漢語測試:盡量減少無關因素對測試的干擾,為學生創造規范的應試環境。
3.擴充樣本的內容和代表性:緊密圍繞教學大綱和教學目標命題,考核內容應全面,并能有效代表學生應掌握的知識領域。
三、信度與效度的關系
對漢語成績測試來說,測試的可靠與有效都很重要。信度和效度的基本關系是復雜的,他們既相互依存,又相互排斥。認識二者之間的這種矛盾本質,有利于我們在編制漢語成績測試時更好地平衡和兼顧它們。
(一)相互依存
信度和效度二者之間是相互依存的。雖然具有一定的信度,并不一定有效,但沒有信度當然就不可能有效度;而沒有效度,信度就毫無意義。要想效度高,信度就必須高。有高效度就一定有高信度,高信度不一定就有高效度。
(二)相互排斥
成績測試的信度和效度二者之間既是相互依存的,又是相互排斥的。因為"從信息的量與質的矛盾來說,對量的測量容易保證信息的高信度,對質的測量容易保證信息的高效度。但是量的測量要求被測的對象必須是可數的,以便用數字加數量單位來表示"(李筱菊,1997)。我們的漢語成績測試是測學生的漢語使用能力,這種能力表現為學生的漢語行為是無限的、不可數的,本質上是不能用數字加數量單位來表示的。漢語成績測試要滿足信度,只有把測試設計為全部是定量型的,但這會影響效度;漢語成績測試要滿足效度,只有把測試設計為全部是定性型的,但這又會影響信度。由此可見,漢語成績測試的信度和效度也是一種矛盾的關系。
綜上所述,因為測試信度與效度之間存在的矛盾關系,需要我們在設計漢語成績測試時綜合平衡考慮效度、信度、可行性。在進行具體的設計操作時,可以采取直接測試與間接測試相結合的方法,用直接測試(如口試、作文)來提高漢語成績測試的效度,用間接測試(如多項選擇題)來提高漢語成績測試的信度,這樣才能逐步提高漢語成績測試的質量。
參考文獻:
[1]楊翼.對外漢語教學的成績測試[M].北京:北京大學出版社,2010
[2]楊翼.漢語教學評價[M].北京:北京大學出版社,2010