999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論大學(xué)英語(yǔ)測(cè)試中質(zhì)量指標(biāo)的應(yīng)用

2012-12-31 00:00:00李海峰
China’s foreign Trade·下半月 2012年12期

【摘 要】 語(yǔ)言測(cè)試是目前大學(xué)外語(yǔ)評(píng)價(jià)體系中的重要組成部分,評(píng)估語(yǔ)言測(cè)試最為關(guān)鍵的兩個(gè)質(zhì)量指標(biāo)是信度和效度,但兩者從本質(zhì)上來(lái)說(shuō)又是相互沖突的。在一定的約束條件下嘗試論證,為了使總效用達(dá)到最大化,在某一特定測(cè)試中我們能夠找到平衡效度和信度的結(jié)合點(diǎn),從實(shí)踐中摸索經(jīng)驗(yàn),由此而為大學(xué)英語(yǔ)測(cè)試的改革實(shí)踐提供一些參考性建議。

【關(guān)鍵詞】 效度 信度 英語(yǔ)語(yǔ)言測(cè)試

語(yǔ)言測(cè)試隨著語(yǔ)言觀的發(fā)展而發(fā)展,也隨著教學(xué)理念、教學(xué)模式的更新而更新。八十年代中期開始流行的交際功能觀和九十年代以后興起的任務(wù)教學(xué)法都對(duì)語(yǔ)言測(cè)試的改革提出了新的要求。

總效用性是評(píng)價(jià)英語(yǔ)測(cè)試最重要的原則。根據(jù)Bachman和Palmer(1996:18)的觀點(diǎn),一般測(cè)試的“總效用性”的主要構(gòu)成因素有六個(gè),評(píng)價(jià)一次考試是否有效用需要綜合考察這些因素,在它們之間尋求最佳的平衡點(diǎn),即效用性(Usefulness)=信度(Reliability)+構(gòu)想效度(Constructvalidity)+真實(shí)性(Authenticity)+互動(dòng)性(Interactiveness)+沖擊力(Impact)+適用性(Practicality)。這里需要說(shuō)明的是:Bachman和Palmer之所以把“構(gòu)想效度”作為“效用性”六大特征之一,是因?yàn)闃?gòu)想效度關(guān)系到我們根據(jù)測(cè)試成績(jī)所作的解釋的意義性和適切性。其它五個(gè)因素均與測(cè)試成績(jī)的使用有關(guān),而“適用性”與測(cè)試的方法有關(guān),能夠在很大程度上決定測(cè)試的可行性。對(duì)于一般學(xué)校考試,教師較多考慮考試任務(wù)的真實(shí)性、互動(dòng)性和對(duì)教學(xué)的沖擊力(或稱后效作用),對(duì)于大規(guī)模考試,考試策劃者需在試卷設(shè)計(jì)和考試任務(wù)設(shè)置時(shí)重點(diǎn)考慮信度和效度,而目前,在中國(guó)的語(yǔ)言測(cè)試中,據(jù)全國(guó)大學(xué)英語(yǔ)四、六級(jí)考試委員會(huì)與英國(guó)文化委員會(huì)的合作研究結(jié)果認(rèn)為:大學(xué)英語(yǔ)四級(jí)和大學(xué)英語(yǔ)六級(jí)是信度很高的考試,每次考試客觀題的內(nèi)部信度都達(dá)0.9以上;效度相當(dāng)高,回收問卷中有92%的教師認(rèn)為CET能反映學(xué)生的實(shí)際英語(yǔ)水平。筆者以為這里所指的信度和效度的界定很模糊,就某次具體的測(cè)試而言,信度和效度是受特定條件限制的,不可能是絕對(duì)的。到目前為止,我國(guó)的高考、研究生入學(xué)考試、公共英語(yǔ)等級(jí)考試(PET),包括CET等大規(guī)模英語(yǔ)測(cè)試還是客觀性題型占的比例較大,主觀題只占10%或20%左右。就評(píng)分方法而言,因客觀性試題答案的唯一性,可用機(jī)器批閱,從而使測(cè)試結(jié)果的客觀性和一致性有了保證,無(wú)疑具有相對(duì)較高的信度,但不足之處就是難以確保效度。同時(shí)大量采用主觀性、直接性試題的測(cè)試在閱卷信度上也令人懷疑。這樣的疑慮總是或多或少存地在于考試的開發(fā)、設(shè)計(jì)和評(píng)估過(guò)程中。

如果我們想檢驗(yàn)一次特定的考試成績(jī)能否真正反映學(xué)生的語(yǔ)言能力,那在設(shè)計(jì)和實(shí)施測(cè)試時(shí),信度和效度是我們首要考慮的問題。Bachman把信度定義為“測(cè)試的一致性”(consistency of measurement)。簡(jiǎn)言之,就是測(cè)試結(jié)果的可信度、可靠度。信度所涉及的問題是個(gè)體測(cè)試成績(jī)?cè)诙啻蟪潭壬鲜怯蓽y(cè)試誤差或其它因素所影響的。個(gè)體測(cè)試成績(jī)?cè)诙啻蟪潭壬虾蛡€(gè)體語(yǔ)言能力相關(guān)效度是所關(guān)注的問題。因此,我們研究信度的目的是使測(cè)試誤差造成的影響最小化,研究效度的最終目的在使我們想要檢測(cè)的語(yǔ)言能力的效果最大化,它們是兩個(gè)相互補(bǔ)充的因素。一項(xiàng)測(cè)試若沒有信度,也就無(wú)所謂效度。信度是效度的前提或必要條件。權(quán)衡信度和效度,效度是首要的。然而Underhill和Heaton指出信度和效度特征在本質(zhì)上是互相沖突的。測(cè)試效度較高的試題有時(shí)測(cè)試信度較低。相反,測(cè)試信度較高的試題有時(shí)測(cè)試效度較低。Morrow也認(rèn)為想把測(cè)試任務(wù)設(shè)計(jì)得兼顧可信性和真實(shí)性不現(xiàn)實(shí)。Hughes卻說(shuō)雖然測(cè)試的各種特征相互排斥,但是這并不意味著我們可以完全放棄這些特征。

我們能否使信度和效度同時(shí)最大化呢?如何平衡信度和效度?Bachman和Palmer在其測(cè)試?yán)碚撝姓J(rèn)為可設(shè)置“可接受的最低程度”的效度或信度等質(zhì)量指標(biāo)從而使得語(yǔ)言測(cè)試的“效用性”(usefulness)原則中各特征之間達(dá)到適度平衡。由于測(cè)試總是在一定的價(jià)值判斷、測(cè)試目標(biāo)、社會(huì)環(huán)境等約束條件下進(jìn)行的,本文嘗試探索在可行性條件下,測(cè)試的總效用(overall usefulness)最大化時(shí)效度和信度之間可能存在的關(guān)系。

通過(guò)以上的理論已經(jīng)證明:信度和效度作為評(píng)估測(cè)試質(zhì)量的兩個(gè)重要基本特性,兩者雖然在表面上和一定程度上是相互矛盾的,但完全可以通過(guò)采取相互協(xié)調(diào)的措施使之達(dá)到適度的平衡,把兩者的優(yōu)勢(shì)發(fā)揮到最大,進(jìn)而保證測(cè)試的總效用性最大化。我們從這一結(jié)論中得到的啟示是:在英語(yǔ)測(cè)試的設(shè)計(jì)和命題過(guò)程中,不能絕對(duì)、片面、盲目地追求或強(qiáng)調(diào)某一方,只有綜合平衡二者的關(guān)系才能獲得最大的總效用。

測(cè)試是教和學(xué)的導(dǎo)向。問題是如何提高測(cè)試的正面反撥效應(yīng),減少負(fù)面反撥效應(yīng)。四、六級(jí)考試長(zhǎng)期以來(lái)采用固定不變的模式,客觀上造成了學(xué)生猜題、押題,教師偏向應(yīng)試教學(xué),產(chǎn)生了不良的教學(xué)效果。Hughes提出了若干提高正面反撥效應(yīng)的建議:測(cè)試要培養(yǎng)能力;測(cè)試內(nèi)容要覆蓋面廣并具有一定的不可預(yù)測(cè)性;盡量使用直接測(cè)試法;成績(jī)測(cè)試要與教學(xué)目標(biāo)相結(jié)合,使用尺度參照等。這些建議多數(shù)涉及效度,也與信度相關(guān)。信度和效度是影響反撥效應(yīng)的重要因素,正確處理好兩者的關(guān)系能使測(cè)試產(chǎn)生積極有利的反撥效應(yīng)。

結(jié)束語(yǔ)

測(cè)試的最終目的是服務(wù)于教學(xué)。作為教師,重視語(yǔ)言測(cè)試?yán)碚摰难芯浚莆彰}的原則,在試卷編制過(guò)程中把握好信度、效度及其它評(píng)價(jià)指標(biāo)之間最佳的平衡關(guān)系,將有利于優(yōu)化各類英語(yǔ)測(cè)試的質(zhì)量,更有效地推動(dòng)英語(yǔ)教學(xué)的發(fā)展。

※黑龍江省社會(huì)科學(xué)項(xiàng)目研究成果 項(xiàng)目編號(hào) 12512083

參考文獻(xiàn):

[1] Bachman,L.F Adrian S.Palmer 1996.Language Testing in Practice.Oxford: Oxford University Press.

[2] Bachman, L.F.1999.Fundamental Con-siderations in Language Testing.[M].Shanghai:Shanghai Foreign Language Education Press.

[3] Carroll, B. J. 1980. Testing Communica-tive Performance: An Interim Study.[M]. Oxford: Pergamon Press.

(作者單位:哈爾濱商業(yè)大學(xué),外語(yǔ)學(xué)院)

主站蜘蛛池模板: 国产精品lululu在线观看| 午夜丁香婷婷| 98超碰在线观看| 成人在线观看不卡| 欧美亚洲欧美| 久久青草视频| 在线无码九区| 国产在线观看精品| 91香蕉视频下载网站| 久久这里只精品热免费99| 亚洲国产理论片在线播放| 国产精品三区四区| 在线播放国产一区| 毛片三级在线观看| 国产精品人成在线播放| 91在线一9|永久视频在线| 亚洲乱伦视频| 天天色综网| 91福利在线观看视频| 在线精品欧美日韩| 欧美精品黑人粗大| 免费观看亚洲人成网站| 久久久久无码精品| 国产精品jizz在线观看软件| 欧美一区日韩一区中文字幕页| 波多野结衣无码中文字幕在线观看一区二区| 国产农村1级毛片| 国产在线91在线电影| 五月婷婷综合网| 国产手机在线观看| 国产精品爆乳99久久| 久久精品中文无码资源站| 欧美国产日本高清不卡| 四虎国产在线观看| 亚洲日韩国产精品综合在线观看| AV无码一区二区三区四区| 亚洲三级电影在线播放 | 亚洲视频三级| 美女潮喷出白浆在线观看视频| 国产成人综合在线观看| 亚洲一区黄色| 91国内在线观看| 国产成人久视频免费| 国产日韩欧美在线视频免费观看| 99久久性生片| 欧美一区二区福利视频| 欧美成人一区午夜福利在线| 久久久久国色AV免费观看性色| 国产男人天堂| 91热爆在线| 成人91在线| 成人国产精品2021| 欧美在线三级| 免费看美女毛片| 亚洲欧美另类中文字幕| 欧美精品在线免费| 欧美色99| 综合色在线| 久久国产免费观看| 日韩在线永久免费播放| 久久久久无码国产精品不卡| 日本日韩欧美| 日韩少妇激情一区二区| 国产精品入口麻豆| 2021天堂在线亚洲精品专区| 国产精品所毛片视频| 国产视频只有无码精品| 国产网站免费| 国产人成网线在线播放va| 一级福利视频| 国产欧美日韩18| 欧美国产菊爆免费观看| 久久 午夜福利 张柏芝| 天天综合天天综合| 色综合激情网| 欧美97欧美综合色伦图 | 不卡视频国产| 原味小视频在线www国产| 国产在线精品美女观看| 亚洲综合网在线观看| 成人午夜天| 午夜精品久久久久久久99热下载|