摘要:效度是語言測(cè)試最重要的準(zhǔn)則之一,本文考查了效度概念中傳統(tǒng)習(xí)慣劃分的四個(gè)類別:標(biāo)準(zhǔn)效度、表面效度、內(nèi)容效度和結(jié)構(gòu)效度。發(fā)展至今,結(jié)構(gòu)效度成為其中最被廣泛接受和最受研究的效度證據(jù)。隨著概念的發(fā)展,效度的證據(jù)來源也有了新的詮釋,文章對(duì)五種證據(jù)來源作了說明。
關(guān)鍵詞:效度結(jié)構(gòu)效度 表面效度 內(nèi)容效度 標(biāo)準(zhǔn)效度 證據(jù) 來源
【中圖分類號(hào)】H31【文獻(xiàn)標(biāo)識(shí)碼】A【文章編號(hào)】1002-2139(2009)-16-0075-01
一、語言測(cè)試中的效度
語言測(cè)試的首要目的是為研究者提供一個(gè)測(cè)量個(gè)體語言能力的指標(biāo)。
效度是測(cè)試的有效性最重要也是最必要的準(zhǔn)則,它體現(xiàn)了實(shí)現(xiàn)測(cè)試結(jié)果的有效程度。效度通常被定義為一個(gè)研究對(duì)研究者所意圖測(cè)量的特定概念所能反映或評(píng)測(cè)的程度。語言測(cè)試中,效度關(guān)系到測(cè)量被測(cè)試者語言能力的研究是否成功,可用來判斷某一項(xiàng)評(píng)分的解釋是否合理,而這個(gè)解釋也涵括了測(cè)試的意義及合理性。這就要求測(cè)試中應(yīng)充分考慮作為基礎(chǔ)的評(píng)分指向的證據(jù)來源,以及評(píng)分應(yīng)用的社會(huì)影響。因而效度并非測(cè)試或測(cè)評(píng)的附屬產(chǎn)物,而是測(cè)試結(jié)果涵義的產(chǎn)物。
二、效度的四個(gè)類型
效度傳統(tǒng)習(xí)慣上被分為四個(gè)類別:表面效度,內(nèi)容效度,標(biāo)準(zhǔn)效度和結(jié)構(gòu)效度。
表面效度涉及測(cè)量方法及其過程是如何呈現(xiàn)的。包括它是否以合理的方式獲取研究員試圖得到的信息,它看起來是否設(shè)計(jì)良好,以及它看起來能否可靠地動(dòng)作。不同于內(nèi)容效度,表面效度不需要架設(shè)理論來獲得支持。表面效度僅僅意味著表面的有效性。由于表面效度的模糊性和主觀性,心理測(cè)試學(xué)者們很久前便放棄了這個(gè)概念。
內(nèi)容效度以測(cè)量方法所能反映的測(cè)量領(lǐng)域的程度為基礎(chǔ),找出測(cè)試內(nèi)容是否反映了測(cè)試的要求。乍看之下。內(nèi)容效度似乎類似于表面效度,但二者是有區(qū)別的。在內(nèi)容效度中,證據(jù)是在考官評(píng)判的協(xié)商中獲得的。簡(jiǎn)而言之,表面效度可以由~個(gè)人確立。而內(nèi)容效度需要一個(gè)專家小組來檢測(cè)。不過,這種方法仍存在一些缺點(diǎn)。有的測(cè)試由內(nèi)容專家編寫出來后,別人看起來十分艱澀,這種情況并不少見。此外,內(nèi)容專家并不辨認(rèn)主題學(xué)習(xí)的宗旨。
標(biāo)準(zhǔn)效度,也稱工具效度,用來證明測(cè)試方法或過程的準(zhǔn)確性,這需要將它與另一已經(jīng)證實(shí)有效的測(cè)量方法或過程進(jìn)行比較。確切地說,標(biāo)準(zhǔn)效度是一種預(yù)測(cè)而不是一種解釋。預(yù)測(cè)是非偶然性或具有數(shù)學(xué)推斷性的,而解釋具有原因或邏輯具有依賴性。由于標(biāo)準(zhǔn)效度的局限性,評(píng)估者必須使用結(jié)構(gòu)效度來進(jìn)行檢驗(yàn)。
結(jié)構(gòu)效度是在理論性概念和具體測(cè)量設(shè)備或過程中尋求統(tǒng)一的一種檢驗(yàn)方法。例如,為了得到一個(gè)可接受的結(jié)構(gòu)效度,發(fā)明新的語言測(cè)試的研究員也許要花費(fèi)大量的時(shí)間來“定義”語言能力的概念。
漢特和施密特(1990)認(rèn)為,結(jié)構(gòu)效度是一個(gè)定量問題。而不是區(qū)別如“有效”或“無效”這樣的定性的問題;它是一個(gè)程度問題。結(jié)構(gòu)效度可以通過測(cè)量?jī)A向的獨(dú)立變量(結(jié)構(gòu))和替代的獨(dú)立變量(指標(biāo),標(biāo)志)之間的交互作用來確定。
盡管效度被分為了四個(gè)類別,但結(jié)構(gòu)效度的概念最終最被廣泛接受。在教育測(cè)量方法的領(lǐng)域里,這四種類型被當(dāng)作結(jié)構(gòu)效度的統(tǒng)一形式的不同層面來進(jìn)行研究。無論結(jié)構(gòu)效度如何定義。目前并沒有研究它的最好的單一的辦法。多數(shù)情況下,結(jié)構(gòu)效度結(jié)構(gòu)效度需要從多種角度搜索大量的證據(jù)進(jìn)行論證。因此,只有使用更多的策略和方法去驗(yàn)證一個(gè)測(cè)試的效度,測(cè)試使用者對(duì)測(cè)試的結(jié)構(gòu)效度才越有信心。
三、效度來源的證據(jù)
前面我們已經(jīng)提及效度的四種類型如今被當(dāng)作結(jié)構(gòu)效度的統(tǒng)一形式的不同層面來進(jìn)行研究,并且需要從多種角度搜索大量的證據(jù)進(jìn)行論證,因此,有必要用一種較新也較好的方法來討論一下效度來源的證據(jù)的問題。
1、基于內(nèi)容的證據(jù)
通過觀察測(cè)試內(nèi)容和測(cè)試結(jié)構(gòu)的關(guān)系可以獲得重要的效度證據(jù)。在擬定測(cè)試內(nèi)容之前,測(cè)試內(nèi)容通常需要界定和分類,而且每部分的內(nèi)容應(yīng)設(shè)定好比例,重要效度證據(jù)可通過這三步來實(shí)現(xiàn)。專家評(píng)測(cè)內(nèi)容效度時(shí),要評(píng)估測(cè)試的每一部分和測(cè)試結(jié)構(gòu)之間的關(guān)系,以及每?jī)刹糠謨?nèi)容之間的相對(duì)比例關(guān)系和必要關(guān)系。
2、基于反應(yīng)過程的證據(jù)
效度證據(jù)還可通過分析參試者的反應(yīng)來獲得。對(duì)反應(yīng)的分析可以考察出測(cè)試意圖評(píng)估的目的與實(shí)際評(píng)估到的結(jié)果之間的一致程度。比如,在意圖評(píng)估推斷能力的測(cè)試中,如果真實(shí)地測(cè)試了參試者的推斷能力,那么這個(gè)測(cè)試就有較高的效度;而如果只是反映了一個(gè)人某種具體知識(shí)或結(jié)論的記憶力,那么該測(cè)試的效度就是低的。研究人員可以通過記錄參試者回答問題的步驟和方法來研究測(cè)試的效度。在一些涉及主觀評(píng)估的測(cè)試中,測(cè)試的結(jié)果既可能受到參試者的影響,也受到評(píng)估者的影響。在這種情況下,應(yīng)該對(duì)評(píng)估者的評(píng)分過程進(jìn)行檢查,為測(cè)試的效度提供證據(jù)。
3、基于內(nèi)部結(jié)構(gòu)的證據(jù)
許多測(cè)試是有具體理論結(jié)構(gòu)作為基礎(chǔ)的,有的測(cè)試是一維的,而有的是多維的。但無論如何,效度證據(jù)可通過考察測(cè)試的內(nèi)容結(jié)構(gòu)來獲得。對(duì)差異項(xiàng)目功能的研究便屬于這個(gè)領(lǐng)域。為測(cè)試效度提供了論證。
4、基于其它變量關(guān)系的證據(jù)
最重要的效度證據(jù)是通過考察測(cè)試結(jié)果與其它獨(dú)立于測(cè)試的變量之間的關(guān)系獲得的。效度證據(jù)首先來源于反映測(cè)試目標(biāo)的測(cè)試標(biāo)準(zhǔn),然后基本的問題在于測(cè)試能預(yù)測(cè)或反映效度標(biāo)準(zhǔn)的程度。如果測(cè)試還沒設(shè)有效度標(biāo)準(zhǔn),那么我們應(yīng)該把重點(diǎn)放在效度的預(yù)測(cè)性上。反之,我們應(yīng)該注重同步效度的問題。
5、基于測(cè)試結(jié)果的證據(jù)
測(cè)試效度與分析測(cè)試結(jié)果的關(guān)系是直接的,在分析中,要求研究人員辨別從測(cè)試中得出的結(jié)果和從與測(cè)試無關(guān)的結(jié)果。例如。測(cè)試者間緊張的競(jìng)爭(zhēng)關(guān)系可能導(dǎo)致死記硬背,從而忽略了開發(fā)解決問題的能力,結(jié)果可能導(dǎo)致個(gè)體發(fā)展的失敗。
四、結(jié)語
總的來說,測(cè)試效度的研究正隨著科學(xué)測(cè)試體系的發(fā)展不斷地更新,日益成熟。研究人員正以更新更好的手段來對(duì)效度進(jìn)行分門別類,把重點(diǎn)放在對(duì)結(jié)構(gòu)效度及其效度證據(jù)來源的研究上。隨著越來越多的證據(jù),我們將理好地利用和解釋測(cè)試的評(píng)分,完善結(jié)構(gòu)效度的定義并提高測(cè)試本身的效度。