999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多元概化理論在教育教學(xué)能力測試中的應(yīng)用

2014-03-30 10:05:54陳宛玉戴海琦
關(guān)鍵詞:教育教學(xué)

陳宛玉,戴海琦

(1.龍巖學(xué)院教育科學(xué)學(xué)院,福建 龍巖 364000;2.江西師范大學(xué),江西 南昌 330022)

我國教師資格證制度自2001年全面實施以來,對我國教師的專業(yè)化發(fā)展起到了巨大的推動作用[1]。《教師資格條例》要求對申請教師資格者的教育教學(xué)能力進(jìn)行考察和評估,并要求各省 (市)制定有關(guān)測試實施細(xì)則。目前國內(nèi)在教師資格認(rèn)定中都把教育教學(xué)能力測試作為重要的把關(guān)環(huán)節(jié),測試主要采用說課 (或試講)、面試、答辯等方式對申請人的教育教學(xué)能力進(jìn)行評估。教育教學(xué)能力測試已經(jīng)在各個省份地市廣泛使用,然而對教育教學(xué)能力測試的專門研究卻不多,僅有的研究主要是對測試標(biāo)準(zhǔn)、實施及其必要性的分析[2-4],尚未有對其心理測量學(xué)性質(zhì)的研究。

概化理論是運用實驗設(shè)計的思想,采用方差分析的統(tǒng)計分析技術(shù),分析測評中的各種變異來源,并進(jìn)行分解、估計與控制的一種測量方法[5-6]。概化理論能夠一次性分析多個測驗誤差變異的來源,既可以適用于常模參照測驗,又可以適用于標(biāo)準(zhǔn)參照測驗。而且更多的從整個測驗的宏觀結(jié)構(gòu)及其與外部測驗條件的基礎(chǔ)上做深入的計量分析,對于評分設(shè)計具有較好的指導(dǎo)作用。概化理論經(jīng)歷了一個從一元到多元的發(fā)展過程。多元概化理論較之于一元概化理論在處理多個測量任務(wù)或目標(biāo)測量問題時具有獨到的優(yōu)勢。

教育教學(xué)能力測試要求評分員對考生多個測評任務(wù)上的表現(xiàn)進(jìn)行評定,其數(shù)據(jù)特點符合多元概化理論分析的要求。本研究運用多元概化理論對教育教學(xué)能力測試數(shù)據(jù)進(jìn)行分析,旨在對教育教學(xué)能力測試質(zhì)量、分?jǐn)?shù)合成的合理性、評分誤差的來源和測試改進(jìn)方案等問題進(jìn)行探討,進(jìn)而為后續(xù)完善測試設(shè)計和評分培訓(xùn)提供參考依據(jù)。

一方法

(一)數(shù)據(jù)來源

數(shù)據(jù)來源于2011年某市組織的高中英語教師資格申請教育教學(xué)能力測試的實測數(shù)據(jù),三位評委對47名考生進(jìn)行打分。該市制定的教育教學(xué)能力測試標(biāo)準(zhǔn)要求評分員從說課、面試、答辯三個任務(wù)評估申請人的教育教學(xué)能力。測試要求對評分員從三個任務(wù)的各個方面都給予考生打分,然后合并計算測試總分,考生最終的成績?yōu)槿齻€評委所評總分的平均分,考生達(dá)到60分以上視為通過測試。本研究所獲取的初始數(shù)據(jù)包括各個評分員對每一考生說課、面試、答辯等任務(wù)的成績。測試的總成績?yōu)?00分,其中說課總分為50分,面試為20分,答辯為30分。

(二)分析思路

教育教學(xué)能力測試包括說課、面試、答辯等三個測評任務(wù),評分員對每個考生在每個任務(wù)都進(jìn)行了評分。因此測試數(shù)據(jù)特點選擇多元概化理論中的三因子的單面隨機交叉設(shè)計 (p˙×r˙)。其中p代表考生教育教學(xué)能力,為測試目標(biāo);r代表評分員側(cè)面,有3個水平。

(三)研究工具

本研究采用多元概化理論分析的專門軟件mGEVENA2.1[7]編寫程序進(jìn)行教育教學(xué)能力測試數(shù)據(jù)進(jìn)行處理。

二結(jié)果

(一)G研究

1.G研究方差分量和協(xié)方差分量的估計

應(yīng)用mGEVENA程序可以得到測量目標(biāo)p和測量側(cè)面r的主效應(yīng)和交互效應(yīng)在說課、面試、答辯三個任務(wù)上的方差分量和協(xié)方差分量估計值。具體結(jié)果見表1。

表1 G研究的方差分量和協(xié)方差分量

由表1可知,三個任務(wù)方差分量的估計值中,說課的方差分量最大 (11.00956),面試的方差分量最小 (1.53114)。這說明在本次測試中說課所起的作用最大,答辯所起的作用其次,面試所起的作用最小。從數(shù)據(jù)結(jié)果上來看,這也與測試設(shè)計者對說課、面試和答辯所賦總分值較為一致。

從被試效應(yīng)的協(xié)方差和相關(guān)系數(shù)來看,三個測試任務(wù)之間協(xié)方差較大,存在較高的相關(guān),其中面試與答辯的相關(guān)相對較低 (0.68294),說課和答辯的相關(guān)最高 (0.78552)。說明考生在三個評分任務(wù)的得分存在較高的一致性。另一方面也反映了在本次測試中將三個任務(wù)當(dāng)做三個測試目標(biāo)進(jìn)行分析是符合MGT的要求的。

從評分員主效應(yīng)的協(xié)方差來看,三個測試任務(wù)之間的協(xié)方差較大,表明評分員在各個測試任務(wù)上的打分一致性較高,即在說課任務(wù)上打分較高的評分員在面試和答辯任務(wù)上的打分也比較高,評分員在各分測驗上評分間的相關(guān)較高。

2.G研究各測試任務(wù)中不同側(cè)面所占的比例

表2列出了G研究各測試任務(wù)下不同側(cè)面所占的比例。

表2 G研究各測試任務(wù)中不同側(cè)面所占的比例

從考生效應(yīng)來看,三個測試任務(wù)的考生效應(yīng)相對都占到了較大的比例,但在面試和答辯任務(wù)上略微較低。三個測試任務(wù)中評分員效應(yīng)所占比例不小,特別是在答辯任務(wù)上,說明不同評分員在評分中所持的寬嚴(yán)程度不一,特別是在答辯任務(wù)上所持的寬嚴(yán)程度差別更大。三個測試任務(wù)中考生與評分員的交互效應(yīng)中占總變異的比例在 8.43% -30.05%之間,其中面試任務(wù)中交互作用所占的比例較高,反映了在面試任務(wù)中評分員更容易出現(xiàn)評分寬嚴(yán)程度不一致的現(xiàn)象,評分員在面試任務(wù)中出現(xiàn)看人打分的情況更為嚴(yán)重。

(二)D研究

1.D研究中方差分量與協(xié)方差分量的估計。D研究設(shè)計與G研究設(shè)計p×r一致,測量模式同為隨機模式,評分員人數(shù)為3。根據(jù)G研究的結(jié)果可得到樣本均值意義上的各種變異來源的方差與協(xié)方差分量如表3所示。

表3 D研究p×R設(shè)計的方差與協(xié)方差分量

(注:矩陣中主對角線上的元素為各效應(yīng)在相應(yīng)因子上的方差分量估計,主對角線以下元素為各效應(yīng)在不同因子間協(xié)方差分量的估計、主對角線之上為因子間相關(guān)系數(shù)的估計。)

2.各測試任務(wù)全域分?jǐn)?shù)估計的精度問題。根據(jù)G研究的結(jié)果,可估計測試任務(wù)的全域分?jǐn)?shù)、相對誤差與絕對誤差估計的方差分量,進(jìn)而計算各個測試任務(wù)的概化系數(shù)和可靠性系數(shù),以及相對信噪比,結(jié)果見表4。

表4 D研究p×R設(shè)計各個測試任務(wù)的概化系數(shù)等指標(biāo)

從結(jié)果來看,說課任務(wù)的全域分方差分量最大,答辯任務(wù)的全域分方差分量其次,這與設(shè)計者賦予的總分基本一致。從概化系數(shù)來看,三個任務(wù)的信度0.83049-0.95289之間,其中說課任務(wù)和答辯任務(wù)的信度基本理想,面試任務(wù)的信度較低。另一方面三個測試任務(wù)的可靠性系數(shù)在0.73955-0.79798之間,普遍不高,這也反映了由于評分員之間存在寬嚴(yán)程度的差異,當(dāng)測試結(jié)果用作絕對決策時存在較大誤差。

3.全域總分的測量精度研究。本研究按照測試的規(guī)定,將說課、答辯、面試進(jìn)行合成,計算全域總分的方差,以及相應(yīng)誤差的方差分量估計,進(jìn)而估計全域總分的概化系數(shù)和可靠性系數(shù),具體結(jié)果見表5。

由表5可以看出,全域總分的概化系數(shù)為0.96524,說明本次測試總體具有較高的信度。全域總分的可靠性系數(shù)0.77232,說明測試的在用于絕對決策時還存在一定的誤差,有待提高。

表5 D研究合成全域分?jǐn)?shù)的方差分量等指標(biāo)的估計

4.各測試任務(wù)對總方差的貢獻(xiàn)比例的研究。根據(jù)以上結(jié)果可以得到各個測試任務(wù)對總方差的貢獻(xiàn)比例見表6。表6中我們也列出了三個測試所賦總分及比例,以比較測試設(shè)計與實際方差貢獻(xiàn)是否一致。

表6 各測試任務(wù)對總方差貢獻(xiàn)的比例與測試任務(wù)賦分比例的比較

從表6來看,三個測試任務(wù)指標(biāo)對全域總分的貢獻(xiàn)比例與設(shè)計者的賦分基本一致。在說課任務(wù)上所賦總分比例為 50%,實際的方差貢獻(xiàn)率為49.91%,基本相接近。面試任務(wù)所賦總分比例為20%,實際方差貢獻(xiàn)率為16.12%,略微低于賦分比例。答辯任務(wù)所賦總分比例為30%,實際方差貢獻(xiàn)率為33.97%,略微高于賦分比例。這表明此次教育教學(xué)能力測試在決定各個測試任務(wù)權(quán)重方面還是做得比較好的。

5.改變評分員人數(shù)對測量精度的影響研究。為了研究改善教育教學(xué)能力測試的方法,本研究通過改變各個測評任務(wù)的評分員人數(shù)來觀察測量精度的變化特點,具體結(jié)果見表7。

表7 改變評分員人數(shù)對測量精度的影響

由表7中可知當(dāng)評分員人數(shù)為1時,全域總分的概化系數(shù)還較高,但可靠性系數(shù)降低較大。當(dāng)評分員人數(shù)為3時,全域總分的概化系數(shù)有較大提高,但可靠性還略微較小,不滿足測評要求。從增幅來看,當(dāng)評分員人數(shù)超過6人時,增加不再明顯。考慮到教育教學(xué)能力測試是一種標(biāo)準(zhǔn)參照測驗,下圖我們單獨分析了可靠性系數(shù)隨評分員人數(shù)不同而變化情況。

圖1 評分員人數(shù)變化對全域總分可靠性系數(shù)的影響

從圖1中我們也可以較為直觀的看出減少評分員數(shù)量和任務(wù)數(shù)量,將導(dǎo)致測試的可靠性急劇下降,當(dāng)試任務(wù)為5個時,可靠性系數(shù)的變化不再明顯,并且基本達(dá)到預(yù)期測試精度。

由圖2所示。

圖2 評分員人數(shù)變化對各測試任務(wù)可靠性系數(shù)的影響

隨著評分員人數(shù)的增加,三個評分任務(wù)的可靠性系數(shù)均有所增加。相對比較而言,不管如何增加評分員人數(shù),說課任務(wù)的可靠性系數(shù)一直高于面試和答辯任務(wù)的可靠性系數(shù)。

三 討論

1.從G研究各主效應(yīng)結(jié)果來看,三個測評任務(wù)中,評分員效應(yīng)都有相應(yīng)的較大的比例,這也反映了評分員在評分中所持的寬嚴(yán)標(biāo)準(zhǔn)可能不同。教育教學(xué)能力測試屬于標(biāo)準(zhǔn)參照測試,評分員的取樣對考生評分有一定影響,在以后的測試中有必要加強評分員隊伍的培訓(xùn),以此來保證測評的公平性。從評分員與考生的交互作用來看,說課和答辯任務(wù)上,交互作用所占的比例較小,說明在這兩個任務(wù)上評分員具有較好的內(nèi)部一致性。面試任務(wù)的考生與評分員的交互作用所占的比例較大,反映了評分員在面試評分中內(nèi)部一致性較差,反映了評分員沒有較好把握面試評分要求。

2.多元概化理論的分析除了報告出各測評側(cè)面的主效應(yīng)和交互效應(yīng)的方差分量之外,同時報告了協(xié)方差分量。協(xié)方差分量為我們提供了額外的信息。考生效應(yīng)的協(xié)方差有助于我們解釋測評任務(wù)結(jié)構(gòu)的合理性,從被試效應(yīng)的協(xié)方差和相關(guān)系數(shù)來看,考生在三個評分任務(wù)的得分存在較高的一致性,將三個測評任務(wù)合并作為教育教學(xué)能力的總體評估具有一定的合理性。評分員主效應(yīng)的協(xié)方差較大表明評分員在各個測試任務(wù)上的打分一致性較高,評分員內(nèi)部一致性較高。

3.本次測試各個測試任務(wù)的合成的全域分?jǐn)?shù)概化系數(shù)在0.96524之間,說明本次測試適合做相對決策。全域分?jǐn)?shù)可靠性系數(shù)在0.77232,微低。考慮到教育教學(xué)能力測試是一種較高利害的標(biāo)準(zhǔn)參照測試,因此還應(yīng)該改進(jìn)測試和增加評分員數(shù)量來提高可靠性系數(shù)。三個測評任務(wù)中,面試的概化系數(shù)最低,評分員在主觀性較高的面試任務(wù)上較容易出現(xiàn)評分的不一致性,因此后續(xù)為提高測評精度,應(yīng)在面試任務(wù)評分上加強對評分員的有針對性指導(dǎo)。從本研究的三個測試任務(wù)對測試總分的方差貢獻(xiàn)量來看,說課任務(wù)的貢獻(xiàn)量最大,答辯其次,面試最小。從貢獻(xiàn)比例和測試設(shè)計者對每個任務(wù)賦分情況的比較來看兩者基本一致,說明本次測試的設(shè)計具有一定的合理性。

從結(jié)果來看,使用三個評分員進(jìn)行評分,做決策時存在著一定的風(fēng)險。提高評分員人數(shù)可以提高決策的有效性和公平性。研究結(jié)果表明隨著評分員人數(shù)的增加,概化系數(shù)和可靠性指數(shù)不斷提高,但增加的幅度遞減。考慮到實際測評的需要和測試的人力成本,將評分員的數(shù)量提到5名是比較合適的。此時的概化系數(shù)為0.97885,可靠性系數(shù)為0.84971,已經(jīng)可以滿足測評的精度要求。當(dāng)然選拔和培訓(xùn)評分員同樣重要。

四 結(jié)論

1.本次教育教學(xué)能力測試將說課、答辯和面試成績進(jìn)行合成是比較合理的。總體而言測試結(jié)果較適合于相對決策,不適宜做絕對決策。

2.三個測評任務(wù)中說課和答辯的評分質(zhì)量較好,面試評分的質(zhì)量較差,后續(xù)尤其需要加強主觀性較強的面試評分方面的培訓(xùn)。

3.影響教育教學(xué)能力測試質(zhì)量的主要原因是評分者寬嚴(yán)程度不一。后續(xù)應(yīng)加強評分員的培訓(xùn),使其統(tǒng)一對各測評任務(wù)的認(rèn)識。

4.通過增加評分員人數(shù)可以提高教育教學(xué)能力測試的精度,但增幅遞減,當(dāng)評分員人數(shù)為5時,結(jié)果已經(jīng)能夠較好滿足測試要求。

[1]魏新春.改進(jìn)與完善我國教師資格證制度的思考[J].臨沂大學(xué)學(xué)報,2011,33(5):23-25.

[2]徐玉斌.初中教師資格教育教學(xué)基本能力測試方案初探[J].河南教育學(xué)院學(xué)報,2003,22(1):30-32.

[3]鄒循東,黃坤,陸家海.為什么對非師范類專業(yè)畢業(yè)的教師資格申請人進(jìn)行教育教學(xué)能力培訓(xùn)考試 [J].廣西教育,2004(11):11.

[4]陳振豪,沈惠君.教育教學(xué)能力測試的建議[J].上海教育,2005(06B):32-33.

[5]BRENNAN.Generalizability theory[M].New York: Springer Verlag,2001:3-5.

[6]楊志明,張雷.測評的概化理論及其應(yīng)用[M].教育科學(xué)出版社,2004:18-20.

[7]BRENNAN.Manual for mGENOVA Version 2.1[M].I-owa:Testing Programs Occasional Papers,2001:45-67.

猜你喜歡
教育教學(xué)
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
軟件工程教育與教學(xué)改革
“雙減”如劍,“體外教育”何去何從?
微課讓高中數(shù)學(xué)教學(xué)更高效
甘肅教育(2020年14期)2020-09-11 07:57:50
如何讓高中生物教學(xué)變得生動有趣
甘肅教育(2020年12期)2020-04-13 06:25:34
教育有道——關(guān)于閩派教育的一點思考
辦好人民滿意的首都教育
“自我診斷表”在高中數(shù)學(xué)教學(xué)中的應(yīng)用
東方教育(2017年19期)2017-12-05 15:14:48
對外漢語教學(xué)中“想”和“要”的比較
主站蜘蛛池模板: 中文字幕无码av专区久久| 国产综合亚洲欧洲区精品无码| 99热这里只有精品在线播放| 毛片在线播放a| 亚洲欧美日韩动漫| 一级一毛片a级毛片| 99视频精品在线观看| 亚洲无线国产观看| 综合网天天| 亚洲天堂成人| www欧美在线观看| 五月天在线网站| 不卡无码网| 超碰91免费人妻| 凹凸精品免费精品视频| 亚洲欧美成人综合| 91精品视频播放| 国产日韩精品一区在线不卡| 国产极品美女在线观看| 国产精品va免费视频| 99久久国产综合精品2023| 国内毛片视频| 色香蕉影院| 亚洲AⅤ无码日韩AV无码网站| 91亚洲视频下载| 国产91透明丝袜美腿在线| 国产特一级毛片| 欧美日韩中文字幕在线| 成人久久18免费网站| 国产精品浪潮Av| 亚洲天堂视频网站| 狠狠亚洲五月天| 亚洲第一页在线观看| 国产免费久久精品99re丫丫一| 91国语视频| 丰满人妻中出白浆| 久久www视频| 亚洲成肉网| 91网站国产| 成人va亚洲va欧美天堂| 丰满人妻被猛烈进入无码| 亚洲人成色在线观看| 久久久精品国产SM调教网站| 欧美午夜在线播放| 综合色婷婷| www成人国产在线观看网站| 欧美一级黄色影院| 国产区在线看| 女高中生自慰污污网站| 亚洲综合片| 国产打屁股免费区网站| 一级毛片在线免费视频| 一本大道无码日韩精品影视| 免费一级成人毛片| 欧美激情综合| 亚洲av片在线免费观看| 波多野结衣一区二区三区四区视频| 国产精品视频公开费视频| 欧类av怡春院| 成年看免费观看视频拍拍| 欧美日韩国产在线播放| 久久国产亚洲欧美日韩精品| 天天色天天综合网| 国产福利不卡视频| 中文字幕一区二区视频| 欧美97欧美综合色伦图| 色综合激情网| 原味小视频在线www国产| 亚洲美女高潮久久久久久久| 91成人在线观看| 精品成人一区二区三区电影| 日韩AV无码一区| 国产福利免费视频| 日本一区二区三区精品国产| 亚洲人成网址| 国产成人精品男人的天堂| 91一级片| a级毛片免费网站| 欧美日韩一区二区三区在线视频| 91色老久久精品偷偷蜜臀| 精品久久久久久中文字幕女 | 人人澡人人爽欧美一区|