999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

標準參照考試理論在高考中的應用——以H省2010—2012年高考理科數學為例

2013-11-01 02:24:02任子朝朱乙藝
數學教育學報 2013年3期
關鍵詞:數學能力

任子朝,王 蕾,朱乙藝,陳 昂

(1.教育部考試中心,北京 100084; 2.北京師范大學 教育學部,北京 100875)

1 理論基礎和研究方法

高考理論上屬于常模參照考試,一般都根據常模參照的理論進行分數解釋,這已經是共識甚至是常識.近年來,國際教育測量領域出現一種傾向,通過對常模參照測驗增加標準參照的分數解釋,從而更為充分和有效地發揮考試對教育教學的反撥作用[1~2].對常模參照測驗增加標準參照的分數解釋至少具有以下兩方面的好處:一方面可以促進高考這一社會考試發揮教育教學功能;另一方面有利于高考試題難度保持穩定.

研究應用IRT理論中的Rasch測量模型,假設考生對于試卷每個試題的反應都受其能力的支配,并建立合適的數學模型來描述它們之間的關系,然后通過對模型中的各個參數進行估計,包括描述考生的能力水平參數以及用來描述試題性質的難度參數,使得考生能力和試題難度分離,進而建立一個等距量尺,從而用不同的試題難度來測量不同學生的能力值.

研究還對試題進行了等值處理,具體做法是首先同時通過“錨題”和“錨人”的等值設計來使2010年、2011年和2012年這3年的高考理科數學建立聯系,然后綜合采用同時校準和錨定參數的方法來使估計出來的參數值置于同一量尺上.這樣通過等值設計和Rasch模型就可以把來自不同試題試卷版本的考試分數轉換到同一個分數系統上,以使得當考生參加測量同一種知識和能力考試的不同試題試卷版本后,其所獲得的分數可以直接進行比較,不會由于不同版本難度上存在差異而引起不公平的現象.

在標準參照分數解釋的框架下,研究還借鑒了標準設定(standard setting)的方法,將能力等級標準分為5級、4級、3級、2級、1級和1級以下,將考生和試題都歸入相應的級別,細化了對考生和試題內部結構的研究.

研究應用Rasch模型,以一個省(H省)的高考理科數學實際考試數據為基礎,研究了不同年份試題的難度分布、考生的水平變化情況,并且對各能力成分進行了分級處理.

2 標準參照考試理論在高考中的應用

2.1 考生能力分布和試題難度分布概覽

H省2010-2012年高考理科數學考生能力與試題難度分布圖見圖1.

圖1中各年份的左側條形圖表示當年高考考生能力分布情況;各年份的右側表示當年高考試題難度的分布情況.圖中的3年的考生能力和試題難度是在同一量尺上測量出來的,因而可以進行直接比較.通俗地說,這些題目就像是量身高的尺子的刻度,通過這樣一把固定的尺子就能夠客觀地測量考生的能力.只要接著做好等值設計,以后該省的高考理科數學都可以接著放到這個量尺上來測量,這樣就可以實現高考跨年度的縱向直接比較.

從圖1中可以看出,2010-2012年該省理科考生數學能力呈較明顯的正態分布,理科學生的數學能力總體上呈現下降的趨勢,但這種變化趨勢還需要進一步的數據和研究加以證實.3年試卷CTT難度均值分別為0.41、0.41、0.34[3].應用等值處理后,3年試卷的Rasch難度均值分別為0.297,-0.053,-0.130,3年考生的能力水平均值分別為-0.108,-0.452,-0.783.從上面的分析可以看出,這3年的考生的能力是逐年下降的,3年試卷的Rasch難度也是逐年下降的,但是3年試卷的CTT難度卻是穩中有所上升,之所以會出現這種情況,是因為試卷CTT難度的變化受考生和試題兩個因素的相互影響,而試卷Rasch難度不受考生能力因素的影響.

2.2 考生能力分等

圖1只是形象說明了3年考生能力水平的變化情況,但具體各層次的考生是如何變化的還不精確.為了更具體精確地了解H省理科數學2010—2012年的考生能力等級結果及其變化趨勢,研究以2010年的考生為基點,將考生按能力水平從高到底排列,分別選擇5%、25%、50%、75%和95%分位點,作為能力層級的分界點,將能力等級標準分為5級、4級、3級、2級、1級和1級以下,對應的考生logit(邏輯單位)位值分別為0.95、0.38、-0.08、-0.53和-1.26.根據以上的分等畫成能力等級分布圖,能力等級分布圖描述了省考生群體的能力分布情況,可以實現不同年度之間各等級的對比.圖2展示了H省這3年的各年度的各能力等級的考生群體在總樣本中所占的比例,圖中縱軸表示百分比,0點以上描述的是2級和2級以上等級的百分比;0點以下描述的是2級以下等級的百分比.不同的顏色區間表示不同的能力等級所占的百分比.從圖2可以直觀地看出H省的理科學生的各等級能力所占百分比在3年中的變化情況,即從2010—2012年,1級及以下等級所占的比例總體上逐年遞增,1級所占的比例逐年遞增,1級以下所占的比例逐年遞增,2級所占的比例逐年遞增,3級所占的比例逐年遞增,4級所占的比例逐年遞減.

圖1 H省2010—2012年高考理科數學考生能力與試題難度分布

圖2 高考數學(理科)標準參照能力等級分布

2.3 試題在能力層級中的定位

各種考試都有各自的能力要求,并且這些要求在試題中體現出來.美國SAT I 主要考查推理論證能力,SAT II 主要考查數學學科能力[4~5].中國的高中數學課程標準以原有的教學大綱為基礎,劃分出了7種數學能力[6].高考數學科所考查的能力分為邏輯思維能力、運算求解能力、空間想象能力、數據處理能力和創新應用能力5個維度[7].高考命題中,按照學科能力劃分的不同維度,通過設立標準參照下各能力分級,根據試題的Rasch難度值進行等級分類,對高考的所有試題在能力等級中做出定位.

表1對2010—2012年H省高考數學(理科)試題按照所考查能力維度和所在的能力等級進行了相應的定位.

在《高考數學能力層次和考查效度研究》[8]中,研究了高考數學各個能力之間的層次關系,其基本結論是創新應用能力是在基本數學能力的基礎上更高層次的能力.文中的能力層級是指單一能力中,不同級別的差異.如可以將邏輯思維能力分為5個層級,分別研究考查各個層級試題的特征.因此約定,能力層次是指各種能力之間的關系,能力層級是指同一能力中,不同級別間的關系.

分析表1可以得出如下的結論:3年各種試卷所考查的能力成分基本穩定,不但各種能力考查的比例相近,而且每一能力所要求的層次及各層級的比例也相近,說明試卷穩定、信度很好.各種能力考查的層級符合考試要求,與考生 的水平基本匹配.

表1 2010—2012年H省高考數學(理科)試題在能力等級中的定位

根據《高考數學能力層次和考查效度研究》,創新應用能力是更高層次的能力,邏輯思維能力本身對數學成績的貢獻在所有能力中是最大的,在加上邏輯思維能力通過創新應用能力的間接貢獻,邏輯思維能力本身對數學成績的貢獻在0.44左右.在實際考查中,對這兩項能力的考查都達到了4級或5級的水平,這是符合能力考試要求的,重點能力,重點考查.

實際考查中對運算能力和數據處理能力的要求一般在3級以下,因為運算能力和數據處理能力屬于基本能力,對其要求也應合理,一般控制在基礎要求.對這兩項能力的過高要求會導致試題的繁瑣和雍長.

從上面的分析可以看出,高考對各種能力成分的考查層級符合考試大綱的要求,并與考生水平匹配.

2.4 考生性別偏差分析

考試公平的理論涵義應是考生的成績只與考查的能力和知識有關,而不應與其社會經濟背景等人口統計變量有關.中國是個多民族大國,改革開放形成了不同的利益群體和社會層級,考試工作者有必要關注不同子群體的考生差異,及時發現和預警值得注意的問題,避免由于不公平現象的大量涌現而給和諧社會造成影響.

利用考生報名表和問卷調查,大量的考生背景數據被保存在數據庫中,使考試題目性能偏倚分析(DIF)等成為可能.圖3為2012年H高考數學(理科)所做的性別DIF檢驗,男、女生的差異為0.16邏輯單位,表明數學試卷對男、女生不存在功能偏差.

3 試卷能力水平分析

建立能力量表,可以進行群體之間的能力比較.但是要想實現不同年份間的試卷原始分等值,還需要更復雜的計算.通過引入期望得分的概念,建立了不同年份之間原始分數轉換表的模型.能力值為iθ考生期望得分為:

其中,Mj為題目j的原始分數,P(θi,bj)為能力值為θi的考生在題目j上的得分概率,bj為題目j的Rasch難度.對于只含有二級計分題目的試卷而言,此公式可以直接用來計算期望得分;對于含有多元計分題目的情況,公式需要進行更復雜的變換.

通過計算能力值logit在[?4,4]的考生期望得分,并且進行年度之間的對應轉換,得到2010—2012年該省高考數學(理科)經過等值后的原始分數對應圖.(見圖4)

圖3 2012年H省高考數學(理科)性別DIF檢驗

圖4中橫坐標表示考生能力logit的取值,范圍為[?4,4];縱坐標表示考生能力值所對應的試卷期望得分.從圖中可以看出,考生各能力值所對應的試卷期望得分基本吻合,說明3年試卷對能力的要求程度基本穩定.特別是對能力水平比較高的考生,相同水平的考生其在3年的原始分數基本相同.

圖4 2010—2012年H省高考數學(理科)等值后的原始分數對應圖

另外,根據得到的原始分數對應圖,可以進行任意兩個年度之間的分數的等值轉換.例如,可以把2011年和2012年的原始分數通過此圖等值到2010年,從而進行3年之間分數的比較.從表2可以看出,在4、5級的水平,3年原始分數的差距在3分左右,說明試卷對高水平能力的考查比較穩定.在2、3級水平,3年的原始分數差距逐漸增大,達到7分左右,說明試卷對中等能力的考查要求有所變化.而在1級水平,3年的原始分數差距又縮小.

表2 標準參照能力等級與原始分對應表

4 結 語

通過對統計數據的分析,可以得出如下4個結論:

(1)應用等值分析的方法可以監測考生水平的變化情況,為命題提供預警.同時也可以檢測試題水平的變化,為評價提供科學的依據.

(2)高考理科數學試卷的能力水平的要求基本穩定,同一能力水平的試卷原始分差距較小.

(3)數學試卷對男、女生不存在功能偏差.

(4)各能力成分的層級要求科學合理,年度間能力層級的要求基本穩定.

在發揮傳統大規模教育考試原有的選拔功能外,從技術上對其加以改造,使之成為客觀等距量尺,可以實現對不同年度或不同次的考試結果進行科學的比較.更進一步,基于增值評價的理念,通過構建同一學科的共同能力量表,可以擺脫傳統考試一次性處理的局限,實現對教學過程的增值評價,引導教學和研究人員科學分析考試結果的變化,診斷學業中存在的問題,促進教育教學良性發展.

[1]王蕾.拉什測量原理及在高考命題評價中的實證研究[J].中國考試,2008,(1):32-39.

[2]王蕾.PISA的教育測量技術在高考中的應用前景初探[J].清華大學教育研究,2012,33(3):105-111.

[3]教育部考試中心.高考理科試題分析(課程標準實驗)(2010—2012年)[M].北京:高等教育出版社,2010—2012.

[4]張紫茵,馬小剛.美國SAT數學考試述評與啟示[J].數學教育學報,2011,20(6):60-62.

[5]廖運章.述評美國高中數學焦點[J].數學教育學報,2013,22(1):65-69.

[6]袁智斌.對《普通高中數學課程標準》文本的反思性解讀[J].數學教育學報,2009,18(6):78-84.

[7]教育部考試中心.普通高等學校招生全面統一考試大綱的說明[M].北京:高等教育出版社,2012.

[8]任子朝.高考數學能力層次和考查效度研究[J].中國考試,2012,(7):3-8.

猜你喜歡
數學能力
消防安全四個能力
幽默是一種能力
我們愛數學
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
你的換位思考能力如何
努力拓展無人機飛行能力
無人機(2017年10期)2017-07-06 03:04:36
我為什么怕數學
新民周刊(2016年15期)2016-04-19 18:12:04
數學到底有什么用?
新民周刊(2016年15期)2016-04-19 15:47:52
抄能力
數學也瘋狂
主站蜘蛛池模板: 亚洲美女一区| 国产综合另类小说色区色噜噜| 国产女人在线视频| 精品人妻AV区| 久久国产高清视频| 亚洲精品图区| 91国内视频在线观看| 国产美女免费网站| 在线免费亚洲无码视频| 国产一级无码不卡视频| 国产永久在线视频| 尤物在线观看乱码| 日韩精品高清自在线| 免费人成又黄又爽的视频网站| 色网站在线视频| av在线5g无码天天| 亚洲中文精品人人永久免费| 国产精品尤物铁牛tv| 欧美自拍另类欧美综合图区| 18黑白丝水手服自慰喷水网站| 国产高清在线丝袜精品一区| 亚洲高清在线天堂精品| 在线看片中文字幕| 成人小视频网| 亚洲中文字幕23页在线| 毛片基地视频| 亚洲国产天堂久久综合| 中文国产成人精品久久| 九色视频线上播放| 刘亦菲一区二区在线观看| 免费不卡视频| 久久永久免费人妻精品| 国产手机在线ΑⅤ片无码观看| 毛片久久网站小视频| 91午夜福利在线观看| 欧美精品在线看| 国产欧美精品午夜在线播放| 无码一区二区三区视频在线播放| 99在线观看视频免费| 伊人激情久久综合中文字幕| 国产免费黄| 亚洲精品无码在线播放网站| 成人国产精品网站在线看| 亚洲欧洲一区二区三区| 国产免费黄| 国产成人综合日韩精品无码首页| 高清精品美女在线播放| 色网站在线视频| 成年人福利视频| 亚洲色图欧美| 亚洲成肉网| 国产免费高清无需播放器| 88av在线| 热久久国产| 欧美综合一区二区三区| 国产成人精品18| 四虎成人在线视频| AV天堂资源福利在线观看| 国产91精品最新在线播放| 蝌蚪国产精品视频第一页| 国产免费自拍视频| 国产一区亚洲一区| 好久久免费视频高清| 国产男女免费视频| 欧美怡红院视频一区二区三区| 4虎影视国产在线观看精品| 强乱中文字幕在线播放不卡| 无码在线激情片| 亚洲性色永久网址| 97无码免费人妻超级碰碰碰| 亚洲精品免费网站| 国产精品久久久久久搜索| 日本不卡在线视频| 色婷婷啪啪| 国产丝袜91| 久久无码高潮喷水| 亚洲欧美综合在线观看| 成年人免费国产视频| 男女男精品视频| 9cao视频精品| 亚洲无码91视频| 国产成人高清精品免费5388|