999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

依標命題要求下考試難度的重構與操作轉化

2025-03-01 00:00:00任建英
教學與管理(中學版) 2025年3期
關鍵詞:核心素養

摘要:難度是把握考試性質、體現學情理解、反映命題質量的重要指標之一。基于學業質量標準合理轉化和闡釋試卷試題難度是依標命題的關鍵所在。改變以往簡單以“了解、理解、應用”等認知性詞語來模糊對應考試難度的做法,結合課程標準中的學業質量要求,我們對現有難度模型進行了重構,這一重構將有利于促進考試與課程標準的緊密銜接,對于考試結果的解釋與使用也將發揮重要的作用。

關鍵詞:核心素養;依標命題;考試難度模型;學業質量水平

引用格式:任建英.依標命題要求下考試難度的重構與操作轉化[J].教學與管理,2025(07):63-67.

依據課程標準進行命題已經成為考試評價最突出的要求[1]。考試難度的“依標”是依標命題的核心要義。難度不僅指向診斷(區分)不同學生的學業水平,更重要的是難度的設定依據要和課程標準充分結合,這樣考試結果才能反映學生學習結果之于國家要求的實現程度。2017年以來,普通高中、義務教育新的課程方案和課程標準相繼頒布。課程標準系統構建了以發展學生核心素養為目標的教學、評價體系。全面依據課程標準命題、強化素養導向是新階段考試的重要要求,最核心的在于兩個方面:一是對課程內容的覆蓋度;二是對核心素養及其水平的考察程度。前者本身具有層次性,現代學習進階、知識結構化等理論已有多方面的研究,主要強調對核心知識的覆蓋,很難具體說覆蓋到何種程度,因為考試要考察學生核心素養發展情況,知識總歸是一種載體。第二方面是本文討論的重點,集中反映為學業質量標準如何有效轉化到考試命題設計之中,這是一個理論問題,也是一個實踐問題。

一、考試難度研究現狀

題目難度以及難度分布是否合適,主要取決于測驗的目的和性質[2]。考試難度是測試測驗的關鍵指標,得到了考評戰線以及研究人員廣泛的重視。當前理論研究主要集中在三個方面:第一,超越難度的數據統計層面,從情緒意義、社會意義等多個角度來建立考試難度結構。有學者從測量難度、感受難度、印象難度構建了高考難度的三元框架,進一步拓展了考試難度的內涵與外延[3]。第二,系統分析考試難度的影響因素。有學者通過實證研究,提出影響物理合格性考試難度的因素包括建模、情境熟悉程度、閱讀量、提示度、認知水平、圖表、推理廣度、數學復雜性、情境結合程度、知識量等[4]。有學者從問題表征(信息呈現方式、信息利用方式、情境陌生程度)、問題解決(知識綜合程度、思維層次)、結果輸出(答案表達方式、答案開放程度)三大維度對影響因素進行了結構化和定量化分析[5]。對于特定類型試題,也要把握好難度影響要素,如開放性試題設問要明確指向考查目標,不能無限開放;評分標準要符合學生的認知水平,不能以教師的思維水平為依據來評價學生[6]。對于特定任務,如聽力任務難度受到輸入語篇(長度、文本復雜度、語音特征、播放次數)、測試任務(指導語、題干等)、試題三大要素的影響[7]。第三,對考試難度設置與控制理論的研究。高中等級性考試難度設計要充分考慮大規模教育考試的測量學要求、試點省份分數轉換的理論模型、高考相關學科的實測數據,體現對高考綜合改革實施的長遠影響[8]。利用代表性小樣本試測新題的方法預控考試難度、采用計算機化自適應測試方式控制考試難度、采用標準設定的方法預估考試難度,可以有效提高測量效果[9]。

總體而言,關于考試以及考試難度的研究在一定程度上都關注到了與課程標準要求的關系,但對于如何把課程標準要求有效轉化到考試命題流程與體系之中,研究很少,指導性、可操作性有限。基于這種情形,把課程標準特別是綜合反映新理念的學業質量要求轉化到多維細目表之中,實現與考試難度設定的有機結合,迫切需要研究突破與指導。

二、考試難度解釋模型

雖然難度是計算出來的,但在命題中怎樣區分試題難易程度,需要一個理論模型或者解釋。當前,預設難度、實測難度都主要分為“難、中、易”三個等級。一場考試的性質集中反映在試卷難度以及難度結構上,即試卷總體難度以及“難、中、易”等級上的試題(分值)比例。“難、中、易”三個等級只是對試題難度的抽象標識,它的設定依據是什么?通常而言,“難、中、易”分別對應“應用、理解、了解”三個認知層次(如圖1)。這三個詞主要來源于布魯姆認知水平分類理論,為了規避該理論在高層次認知活動上的交叉與模糊,在考試中將布魯姆“了解、理解、應用、分析、綜合、評鑒”六個層級概化為“了解、理解、應用”三個層級。這種處理一定程度上解決了一些理論上的問題,而且從字面上或者直觀來講,“了解、理解、應用”三個詞的層級差異性比較明顯。但進一步分析可見,其自身的理論困境仍舊沒有解除。比如,一點不“理解”的“了解”有多大意義,特別是在人工智能迅猛發展的背景之下;不能“應用”的“理解”是真的“理解”嗎?姑且不論認知動詞之間的邊界問題,動詞本身具有的模糊特點實則才是最大的困難與問題所在。有人認為,正是這種模糊性質才給了命題人員與評卷人員空間與張力,說得難聽一點,總會拼湊出一個合理的結果來回應各方面的質疑。然而,這與基礎教育階段新課程的理念和要求相去甚遠。

如果以“了解、理解、應用”來表征特定試題任務所需學生的認知層級,那么核心素養在哪里?具體而言,有三個突出問題:第一,“了解、理解、應用”的認知要求與核心素養如何關聯?當前,一種折中的做法是,在多維細目表中仍然對每一道題使用“了解、理解、應用”來標識難度,同時說明該題考察的核心素養。然而,考察的核心素養以及學生應有的表現與難度是什么關系?比如,學生達到“了解”的表現要求,學生素養發展相應是怎樣的?這些都是當前難度模型或解釋的突出矛盾或者不足。第二,是否符合課程標準的要求?有人說,“了解”主要指向記憶性試題,那么記憶性試題和素養導向的試題是什么關系?其考察目標與相應的學業質量要求是否一致?第三,不利于診斷和改進。倘若依托“了解、理解、應用”來標識難度,考后就很難描述清楚一個學生的素養發展狀況,對于下一步學習的指導性便非常弱。以上問題都需要我們構建一個關于考試難度的新的解釋模型,并合理使用之。

三、考試難度新模型的構建與操作轉化

利用布魯姆認知分類體系來指導考試命題,在一定歷史時期內,在世界范圍內取得了突出的成就。然而,探討教育目標分類的理論研究沒有停止,布魯姆理論的弊端越發凸顯,最突出的問題有三個:一是經驗性的描述用于確認顯性的行為問題不大,要用來確認穩性的、抽象的思想和情感就很困難,或者因描述過于抽象而導致泛化不可操作,或者因描述過于具體而失去目標的本意。這一問題在紙筆考試中更加突出。二是當目標涉及高層次的思維活動時,其邏輯也有很大問題,所作的描述與被描述的目標行為之間有較大的差異。三是“了解、理解、應用”等認知要求對于表征學生發展是單維的、不全面的,布魯姆本人也曾嘗試從認知、情感意志、動作技能三個領域來描述學生學習成果,只是后兩個領域由于不成熟而沒有得到應有的關注和使用[10]。但奉之為圭臬的我國考試實踐卻未能充分重視這些新思考、新進展,特別是不能有機結合新的育人理念,探索符合我國教育發展需要的難度模型,這是不合理的,也是不應該的。

1.考試難度新模型的構建

為了更好地發揮考試的診斷與改進功能,我們必須改變現有考試難度模型的模糊化解釋,明確回歸到對學生學業表現綜合化、全面性要求更好的學業質量標準上來。學業質量標準以核心素養(包括正確價值觀、關鍵能力、必備品格,而不僅僅是認知要求)為主要維度,結合核心內容、典型任務等,對學生學業成就的表現特征進行了整體刻畫。從政策和理論的角度講,學業質量標準對于特定考試的試卷和試題難度給出了較為清晰的邊界。至于學業質量標準的表述方式,我們可以結合SOLO理論[11]來理解,其追求一種刻畫學生核心素養整體性的發展“階梯”。基于以上討論,我們對圖1所示的難度解釋模型進行了重構,將課標中的學業質量要求細化為若干水平,如水平A、水平B、水平C,代替“了解、理解、應用”,并分別對應“難、中、易”三個難度層次(如圖2)。

2.考試難度新模型的操作轉化

“操作轉化”可以概括為“水平細化、結構對應、試題具化”三個重要環節。這三個環節缺一不可,“水平細化”是“結構對應”的基礎,“結構對應”為“水平細化”提供方向,為“試題具化”提供基本依據。前兩者由課程標準中的學業質量要求演繹而來,是抽象概括的,具有一般性;后者結合具體測驗題目的情境、內容、任務等進行表述。

(1)水平細化

對照特定考試性質與功能,將課程標準提出的學業質量參照水平細化為3個水平。這里說明兩個問題:一是在一次考試中要有差異化的不同水平來滿足命題需求,即要從這一參照水平中生發出更多水平(如圖3)。然而,要從這個參照水平生發出一個略高的水平和一個略低的水平如圖3中的模式一,還是生發出的水平都比參照水平低如圖3中的模式二?這兩種模式哪一種更好需要進一步討論。二是細化的水平越多,考后的反饋指導就越精細和精準,比如五個水平。

下面以初中學業水平考試為例進行討論。此時,圖3中的“參照水平”便是學生學完九年義務教育課程后的“畢業水平”。模式一的優勢在于,全面遵循了課標提出的“畢業水平”的要求,但在命題上,水平C雖然只是略高于參照水平,卻又容易讓這種模式陷入“超標”的質疑。在實際操作過程中,要把握好水平C、水平A與水平B之間的距離,確保比較接近。模式二的優勢非常突出,完全落實了“不超標”的要求,但也存在一個潛在的問題,低于參照水平的水平B和水平A應該是什么水平。通常有人會說,試卷中有一些“送分”題,說的就是這些水平對應的試題,但存在“送”到何種程度的問題。比如,極端一點,讓水平A對應義務教育第一個學段(1~2年級)的學業質量要求,當然絕大多數甚至是100%的學生都能夠正確作答相關試題。但如果水平A對應7年級的學業要求,那么有些學生不一定可以得到滿分。當然,沒有任何文件規定過水平B、水平A應該對應哪一個年級或者學段的水平,但水平B和水平A應該比較接近“畢業水平”,而不是無限度地下沉到小學,這是初中學業水平考試的性質和定位決定的。按照模式二,以數學“抽象能力”“運算能力”為例呈現細化結果(見表1)[12]。需要指出的是,表1以素養為維度呈現,并未將所有素養統整起來表述學生發展水平,這有待進一步研究和完善。

(2)結構對應

將難度劃分與細化水平充分對應起來,比如三個水平分別對應“易、中、難”;如果細化為五個水平,就可以對應到更加精細的難度結構上,如“易、較易、中等、較難、難”。在這種對應之后,試題難度就直接關聯到了課程標準中的學業質量要求,而不是漏洞百出且模棱兩可的“了解”“理解”或“應用”。具體呈現在多維細目表之中(見表2),其中“學業考察水平”便是上述“細化水平”。

(3)試題具化

在表2中,要明確每一道試題考察學生到什么水平,并在“學業考察水平”中寫出學生作答該試題應有的表現。整個試卷要對不同的難度水平進行結構性覆蓋,符合考試性質、目的要求。為對上述模型及其使用作出更清晰的說明,我們選擇下題為例進行分析,以展示實操過程和主要做法。

為了解蘇州市的地鐵線路圖,某校學生在網上查到部分線路圖并利用網格畫出示意圖(示意圖是軸對稱圖形)(如圖4)。現建立平面直角坐標系,使得圖中表示石路站點的點A的坐標為(-1,1),表示臨頓路站點的點D的坐標為(2,0),且測得AB=BC,∠ABC=135°,則表示蘇州火車站點的點C的坐標為" " " " " "。

該題主要考查學生的空間觀念和運算能力。試題任務雖然源于現實情境,但是已經基本完成了對真實問題的建模,不僅繪制了示意圖,而且給出了A點和D點的坐標,因而直角坐標系的建立非常容易。結合軸對稱圖形和相關角度的提示,試題本身的計算也偏簡單。基于本文探討的主要問題,現主要呈現試題的考察意圖、學業考察水平以及預設難度系數。學業考察水平的表述應該是表1中水平A在該題的具體化(見表3)。若干題目接續呈現在表2中,結構性覆蓋應考察的核心素養及其不同水平。

學生核心素養發展狀況主要依據其在解決實際問題過程中的表現來判斷。為進一步強化真實問題解決,我們對上題作了一些調整,以更加突出建模方面的考察。建模意識和能力是學生“會用數學的眼光觀察現實世界、會用數學的思維思考現實世界、會用數學的語言表達現實世界”的關鍵方面,改編后的題目將對教學方式轉變發揮更加積極的引導作用。

圖4所示為蘇州市部分地鐵線路圖。圖中線路可近似看作軸對稱圖形,蘇州火車站所在交角近似為90°。當前,某校學生在養育巷站,打算乘坐地鐵,在最短時間內到達蘇錦站。

(1)建立適當的平面直角坐標系,并近似標注沿途各站坐標。“養育巷-樂橋”兩站為1個單位長度。

(2)假如1個單位長度為1cm,圖6比例尺為1:150000。結合生活經驗,估算學生需要多長時間到達目的地。

改編后的題目具有了更強的開放性,學生需要根據插圖明確各個站點、線路之間的位置關系,通過測量和比例尺來估算各點之間的距離。在建立直角坐標系的過程中,相比改編前,坐標原點不固定,給了學生更多選擇與解釋空間。同時,學生需要結合生活經驗估算地鐵行進速度,并對加速和減速過程進行適當假設(初中學生可以假設整個過程作勻速運動,但是必須要體現出對這一要素的考慮與假設,確保論證嚴密)。這種改編在一定程度上會增加試題難度,可形成該題的多維細目表(見表4)。

對于更好體現素養立意的開放性試題,存在一個突出問題:試題的學業考察水平與評分標準(細則)有什么關系?評分標準(細則)的設定與難度控制關系很大,在開放性試題(給學生多重論證和解釋的空間,結論不確定、不唯一,關注學生的論證過程以及邏輯性合理性)的作答中尤為突出。當學生作答表現符合了該題所設定的學業考察水平,應該獲得滿分,且滿分之上的作答不再進一步區分。有人提出,為什么要在主觀上模糊學生更高水平的表現,從而弱化考試對學生的診斷與改進功能?在一定程度上講,學生在開放性試題上的表現是上不封頂的,如果以最好的學生表現作為滿分答案,容易導致整體分數的下滑,影響實測難度以及難度控制情況,這要綜合考試的性質和目的來看待。

四、考試難度新模型使用的思考與建議

根據上述難度設計與實踐操作的探討,在一次考試結束之后,我們可以進行三個方面的分析,以彰顯和深化這種難度新模型的優勢,推進基于課程標準的“教學評”一致性。

首先,對照多維細目表,分析試卷和試題實測難度和預設難度的一致性,特別是對于偏離預設難度較大的題目,要專門討論表3(或表4)中“學業考察水平”的設定和表述,全面分析偏離的主要原因,為下一步命題規劃的改進提出建議。其次,考量每一道試題考查目標的實現情況與水平細化結果的一致性。如果偏離應有水平的試題較多,需要進一步考慮當地教情學情與學業質量要求的距離,為區域教育質量改進明確方向。進一步講,從更大的范圍來說,這種對學生整體情況的反思也可以作為對課程標準中學業質量的校正依據。同時,根據學生作答,可以形成學生素養發展的質性分析報告,對學生進一步規劃學習發揮參考作用。再次,充分認識和把握實測難度、預設難度之間的差距與教學方式之間可能存在的隱性矛盾。比如,對于特定試題,預設難度是0.8,但是實測難度卻是0.5乃至更低,那么原因是試題考察水平設定不合理,還是試題本身出了問題?如果這道題是為了充分考察學生核心素養而設計的開放性、探究性試題,而我們日常教學又很少有時間有機會讓學生經歷開放探究的學習過程,這種不適也可能造成實測難度、預設難度之間的巨大偏差。這個時候,需要理性認識這一情況,堅持素養考察的命題方向,而不能簡單地否定或者排斥。

參考文獻

[1] 教育部關于加強初中學業水平考試命題工作的意見(教基〔2019〕15號)[EB/OL].(2019-12-20)[2024-09-05]. http://www.moe.gov.cn/srcsite/A06/s3321/201911/t20191128_409951.html.

[2] 黃光揚.教育測量與評價[M].上海:華東師范大學出版社,2022:64-67.

[3] 于涵.中國高考難度分析理論構建初探[J].中國考試,2024(02):1-10.

[4] 馮雪媚,張殷.物理合格性考試試題難度影響因素的實證研究[J].招生考試研究,2022(04):1-16.

[5] 劉芳,王偉群,吳星.高中學業水平考試試題難度模型建構[J].化學教育(中英文),2022,43(21):43-47.

[6] 陸璟.考試要有效體現對學生成長有價值的內容——“雙減”背景下提高中考命題科學化水平的思考[J].人民教育,2022(09):39-41.

[7] BRINDLEY G, SLATYER H. Exploring task difficulty in ESL list-ening assessment [J]. Language Testing,2002,19(04):369-394.

[8] 趙雪,宋寶和.普通高中學業水平選擇性考試的難度設計研究[J].教育理論與實踐,2022,42(02):18-22.

[9] 楊志明,徐慶樹.考試難度及其測量學調控手段[J].教育測量與評價,2022(04):3-10.

[10] 馬扎諾,肯德爾.教育目標的新分類學[M].2版.高凌飚,吳有昌,蘇峻,譯.北京:教育科學出版社,2012:2.

[11] 彼格斯,科利斯.學習質量評價:SOLO分類理論[M].高凌飚,張洪巖,譯.北京:人民教育出版社,2010:27-32.

[12] 中華人民共和國教育部.義務教育數學課程標準(2022年版)[S].北京:北京師范大學出版社,2022:82-83.

【責任編輯" " 王澤華】

* 該文為教育部課程教材研究所2024年度科研發展基金課題“核心素養導向的命題理論與實踐研究”(JCSZD24005)的研究成果

猜你喜歡
核心素養
發展學生核心素養探究
提升小學數學核心素養的實踐
關于提高學生核心素養的研究
基于核心素養下的高中生物實驗拓展式教學模式的實踐研究
拓展語文外延 提升核心素養
小學低段數學教學中如何培養學生的核心素養
思想教育視域下公民核心素養教育的研究
考試周刊(2016年86期)2016-11-11 08:51:29
如何培養學生的化學核心素養
考試周刊(2016年79期)2016-10-13 23:11:06
作為“核心素養”的傾聽
今日教育(2016年7期)2016-10-08 09:44:23
“1+1”微群閱讀
主站蜘蛛池模板: 一区二区三区精品视频在线观看| 欧美国产日本高清不卡| 国产国语一级毛片| 操国产美女| 精品国产三级在线观看| 日韩毛片视频| 欧美国产在线一区| 99久久精品美女高潮喷水| 亚洲视频一区在线| 成人午夜福利视频| 久久精品无码一区二区日韩免费| 呦视频在线一区二区三区| 日韩乱码免费一区二区三区| 在线看片中文字幕| 日韩天堂网| 亚洲欧洲日韩国产综合在线二区| 在线免费不卡视频| 日韩精品欧美国产在线| 最新日韩AV网址在线观看| 欧美性爱精品一区二区三区| 久久久久九九精品影院| 色综合五月婷婷| 欧美成人精品在线| 亚洲天堂自拍| 亚洲第一视频网站| 亚洲日本中文字幕天堂网| 国产SUV精品一区二区6| 日本久久网站| 日韩不卡高清视频| 亚洲伊人天堂| 国产免费福利网站| 精品视频一区在线观看| 日本免费福利视频| 亚洲第一极品精品无码| 中文无码伦av中文字幕| 国产美女无遮挡免费视频| 国内精自线i品一区202| 久久综合结合久久狠狠狠97色| 国产哺乳奶水91在线播放| 久青草免费视频| 精品久久人人爽人人玩人人妻| 久久久久人妻一区精品| 欧美乱妇高清无乱码免费| 国产一级毛片yw| 欧美激情综合一区二区| 五月天天天色| 日本午夜三级| 在线观看无码a∨| 久久无码av一区二区三区| 不卡无码网| 91丝袜乱伦| 国产精品尤物在线| 欧美不卡在线视频| 四虎成人精品| 国产精品视频久| 亚洲综合久久一本伊一区| 国产黄色爱视频| 国产一区二区三区精品久久呦| 成人无码一区二区三区视频在线观看| 亚洲欧美另类久久久精品播放的| 国产日韩精品一区在线不卡| 国模私拍一区二区三区| 亚洲国产精品日韩专区AV| 国产第一页第二页| 亚洲无卡视频| 免费A级毛片无码无遮挡| 91久久偷偷做嫩草影院| 久久99久久无码毛片一区二区| 久久综合婷婷| 青青青伊人色综合久久| 色综合中文字幕| 老司机精品99在线播放| 欧美在线一二区| 毛片大全免费观看| 亚洲欧洲一区二区三区| 欧美亚洲激情| 久久黄色免费电影| 国产美女一级毛片| 国产无码精品在线播放| 精品久久久久无码| 亚洲无限乱码一二三四区| 国产成人AV男人的天堂|