呂世虎,于麗芳,王尚志
數學試卷綜合難度的內涵及其指標體系建構
呂世虎1,于麗芳1,王尚志2
(1.西北師范大學教育學院,甘肅 蘭州 730070;2.首都師范大學,北京 100048)
數學試卷的難易取決于客觀和主觀兩方面:客觀方面指作為客體的試卷本身內容和結構所決定的難易,即絕對難度;主觀方面指作為實踐主體的學生其水平所決定的難易,即相對難度.數學試卷的難度是主觀與客觀的統一,由絕對難度與相對難度共同決定.基于此,提出數學試卷綜合難度的概念,并結合已有文獻選擇部分中考數學試卷為案例進行量化分析,構建用試卷題型及其順序、試卷題量與考試時間、試題難度分布、試卷閱讀量、試卷新穎性、學生實際水平等6個要素刻畫的數學試卷綜合難度指標體系.
數學試卷;綜合難度;指標體系
2018年8月教育部啟動中考命題評估工作,目的之一是“構建命題質量保障和提升機制”,促進命題單位改進命題工作.命題評估包括對試卷質量的評估,一項重要的指標是試卷難度.在對各命題單位提供的數學試卷信息進行分析時,一貫用得分率評判數學試卷難度的方法出現了問題,不能清晰地給出判斷,疑問之處頗多,以下舉其中兩種情況為例予以說明.
第一種情況的問題出現在對E、F兩個地區試卷難度評判過程中.E、F兩個地區試卷相關信息如表1~表3所示.

表1 E和F兩地區試卷信息a
根據表1的數據,按照得分率來判斷兩地區的試卷難度,得分率高的試卷容易,得分率低的試卷較難.E地區試卷得分率為0.73,F地區試卷得分率為0.49,因此F地區試卷難度大于E地區.但是,若將兩地區試卷題量(試卷中的小題數)納入考慮(如表2所示),便出現疑問.

表2 E和F兩地區試卷信息b
根據表2的數據,E地區試卷題量為40,F地區試卷題量為29,也就是說E地區學生需要完成的試題數量比F地區學生多11.盡管從得分率來看E地區試卷難度小于F地區,但E地區試卷題量遠大于F地區,據此能否判斷為兩地區試卷難度相當呢?
進一步把考試時間納入進行分析(如表3所示),也會出現疑問.

表3 E和F兩地區試卷信息c
根據表3中的數據,E地區考試時間為120分鐘,F地區考試時間為100分鐘.E地區考試時間長,學生答卷時思考的時間多,但由于題量大,所以試卷難度不??;F地區考試時間短,學生答卷思考時間少,但由于題量少,所以試卷難度也不是很大.能否就此解釋為E地區和F地區的數學試卷難度相當呢?
第二種情況的問題出現在對M、N兩個地區試卷難度評判過程中.M、N兩個地區試卷信息如表4、表5所示.

表4 M和N兩地區試卷信息a
根據表4中的數據,M和N地區試卷的題量、考試時間相當,題量分別為36、32,考試時間均為120分鐘.兩份試卷的得分率分別是0.64、0.62,可以判斷M地區和N地區數學試卷難度相當,這似乎沒有疑問.

表5 M和N兩地區試卷信息b
然而根據表5中的數據,兩份數學試卷字符數(即試卷閱讀量)M地區為3?693,N地區為1?605,M地區數學試卷的閱讀量明顯大于N地區.按照第一種情況的分析思路,雖然兩份試卷得分率近似,但M地區學生在相同時間內需要閱讀、理解、甄別大量信息,N地區學生需要閱讀、理解、甄別的信息相對少了許多,能否解釋為M地區試卷難度大于N地區呢?
從上述兩種情況中可以發現,根據不同的試卷信息判斷試卷難度會出現不同結果,依據得分率判定數學試卷難度的合理性值得反思.目前對試卷難度并沒有明確界定,許多教育測量學專著和考試理論研究文獻將難度視為試題分析的一個參數,對數學試卷難度的研究大都聚焦于試卷中試題的難度,主要圍繞內容難度與統計難度進行.內容難度是依據試題所屬知識水平層次、試題所考查知識點的深廣度、推理步驟及技巧的靈活性等所作的難易程度的判定.統計難度則是考試后用統計的方法計算得到的難度值,即得分率.一道試題的難度就是考生對該題的通過率或得分率.對于答對得1分,答錯或不答得0分的試題,難度就是答對試題的人數與考生總數之比.對于滿分大于1分的試題,難度則是考生對該題的平均得分與該題滿分量之比.不難發現,將試卷難度主要指向數學試卷中的試題難度,對試卷的難度衡量并不是很全面,試題難度與試卷難度畢竟不能等同;而得分率只考慮學生的成績,并未將影響試卷難度的其它方面納入考慮.
至此可以肯定得分率已不足以刻畫數學試卷的難度,數學試卷難度不只是統計難度(得分率)、內容難度,還包括試卷結構(如試題數量、考試時間、試卷閱讀量等)帶來的難度.那么,數學試卷難度的內涵是什么?影響數學試卷難度的要素有哪些?這是研究探討的主要問題.
難度是客體妨礙主體認識和實踐的阻力程度[1].數學試卷作為考查學生能力水平的工具,其對學生完成答卷的阻礙是多方面的.作為妨礙學生完成答卷的客體,其阻力程度一方面來自于客體自身客觀存在的阻力,即試卷內容、結構帶來的阻力;另一方面來自于主體自身能力水平的大小,學生作為完成答卷的實踐主體,其自身的思維、能力水平各不相同,面對試卷客觀存在的阻力其表現度(或感受度)也是不同的.如果說試卷內容、結構帶來的阻力是數學試卷這一客體的絕對難度,那么,當面對著具體的主體時絕對難度發生變化,即學生的實際水平使得試卷的絕對難度具有了相對性.
研究者從主客體統一的角度出發,綜合試卷內容、結構、學生能力水平提出數學試卷綜合難度的概念:數學試卷綜合難度是指數學試卷的內容、結構妨礙學生完成答卷的阻力程度.數學試卷綜合難度是數學試卷作為客體對實踐主體學生的阻力程度,包含主體和客體兩個標向,是主客體的統一,對數學試卷難度的刻畫是整體性的.以往對數學試卷難度的判斷大多利用試題內容難度或得分率,而試題內容難度只是試卷絕對難度的一部分,得分率則是在試卷投入使用測試結束后,著重反映試題內容難度的指標.以此評判試卷難度對命題者改進命題、提升命題質量提供的信息不全面,對數學試卷難度的評判也缺乏整體性.盡管對學生主要的阻力來自試題的內容難度,但展現在學生面前的是一份完整的試卷,其結構因素仍會為學生完成答卷帶來相應的阻力,且其阻力程度是不能忽略的.已有研究也涉及到部分試卷結構因素,但這類研究并沒有將試卷結構與試卷的難度緊密聯系起來,只是就命題過程中試卷結構的技術指標而言的[2].
數學試卷綜合難度從主客體統一的角度,整體闡述了數學試卷中的絕對難度與相對難度.絕對難度即客體自身存在的難度,包括試卷內容和結構兩部分,相對難度由實踐主體學生的實際水平決定.因此,數學試卷綜合難度指標體系包括以下6個方面:試卷題型及其順序、試卷題量與考試時間、試題難度分布、試卷閱讀量、試卷新穎性、學生實際水平.前面5個指標體現在數學試卷內容和結構方面,學生實際水平體現在絕對難度的相對性.
在數學試卷內容和結構中,不同題型對學生運算量、思維量以及數學表達的要求程度不同,題型的選擇及其順序安排影響試卷的綜合難度.題量的多少以及考試時間的長短對學生用于解答每道題的時間有客觀限制,會引起試卷綜合難度的變化.不同難易水平的試題需要學生理解、掌握的知識量不同,思維層次也不一樣,反映試卷中易中難試題多少的試題難度分布就成為影響試卷綜合難度的一個要素.試卷閱讀量的大小因與題型、時間關系密切,不僅考查學生的理解能力,而且考查學生的閱讀能力及解題速度,同樣影響試卷的綜合難度.試題的新穎性反映了試題對學生的挑戰度,也影響試卷的綜合難度.學生實際水平則是影響試卷綜合難度的關鍵指標,不同地區學生生活經歷、知識水平、思維發展的差異決定了學生完成答卷阻力程度的不同.
以上數學試卷綜合難度的指標是否合理呢?研究者選擇2018年東部、中部、西部?。ㄊ校┲锌紨祵W試卷共32份進行分析,通過對這些試卷的定量與定性分析闡釋數學試卷綜合難度6個指標的合理性.由于所選取的試卷中并非每一份試卷各方面數據都完備,因此每一指標可能選取不同試卷數據進行定量分析.
數學試題按題型可分為是非題、選擇題、填空題和解答題.是非題即判斷對錯題,指判斷基本概念、關系、命題的真假的試題.選擇題包括單項選擇題和多項選擇題[3].填空題是對某些基礎知識、簡單計算問題等的要素或結果設置空白,讓學生填出正確結果的試題.解答題包括求解題、證明題、應用題、開放題和探究題等,是要求學生寫出求解、證明、分析或探索過程的試題[4].有研究也將數學試題類型分為主觀題和客觀題,其中解答題屬于主觀題,其余屬于客觀題;也有研究將題型分為選擇題和非選擇題[5].中國中考數學試卷中的題型有選擇題(特指單項選擇題)、填空題和解答題3種.選擇題的正確答案唯一,答案的范圍明確,學生只需進行選擇,難度較低;非選擇題具有一定的開放性,沒有提示可能的解題思路,而且能夠較為全面地考查學生的能力,相對選擇題來說難度較大.填空題不需要寫出思維過程,不考查學生的數學表達,但沒有答案選項提示,所以其難度相對選擇題來說稍大,相對解答題來說較?。畯倪@個意義上說,一份數學試卷中選擇題難度最低,填空題難度次之,解答題難度最大.
題型順序是指在一份數學試卷中不同類型試題呈現的次序,題型呈現的順序也會引起試卷難度的變化.在收集到的數學試卷中,云南省中考數學試卷的題型順序不同于其它試卷,先呈現了填空題,其次是選擇題和解答題.在對云南省中考數學試卷進行分析后發現,試卷中試題內容難度一般,都是比較基礎的題目,甚至是相對容易的,其中也沒有新穎的、探究性的或是背景復雜的試題,但考試后的得分率很低.因此可以推斷,其中一個原因可能是試卷題型的順序安排帶來了試卷難度的增加.上述題型難度是從一般意義上來說的.實際上,題型難度具有相對性,有些選擇題可能會比填空題甚至解答題都難.中國中考數學試卷的題型設置一般情況為選擇題、填空題、解答題,試卷中的順序也是如此.
不同難度題型及其呈現順序會影響試卷的整體難度.命題時在選擇題、填空題、解答題3種題型中選擇一種、兩種或3種題型及每種題型呈現的順序,對學生完成答卷的阻力程度是不同的,對試卷綜合難度也是有影響的.在試卷難度評估時,不能忽略試卷中題型及其順序這一要素;在命題、組卷時,可根據具體的難度要求,通過調整試卷題型及其順序調整試卷的綜合難度.
試卷題量也稱作試卷長度,在一份數學試卷中試卷題量常指小題數量,即若一道解答題分3個小問,則按照3道題計算.題量與考試時間共同決定了學生解答一道試題所用時間的長短.每一道試題都需要學生花費時間進行理解與分析,對試題不同程度的理解與分析反映著試卷阻礙學生解答的不同阻力程度.相同考試時間內,題量大的試卷學生平均解題時間少,且試卷考查的知識點較多,學生進行的運算量、思維量大,而較短時間的思考引起理解與分析得不透徹,試卷難度會增加;相反,題量少的試卷學生平均解題時間充足,可以對題目進行清晰、完整、透徹地理解、分析與解答,試卷的難度會相應減弱.很多學生在考試時對于費時多、得分少的試題選擇放棄,原因也在于此.因為這樣的試題耗時長,無形之中“縮短了”對其它試題的思考與解答時間.因此,命題時試卷中甚至試卷每一題型中的題量都需要仔細斟酌,考試時間的長短也應與題量相協調[3].
中國中考數學考試時間多為120分鐘,極少地區為100分鐘,通過統計32份數學試卷中題量與考試時間的設置發現其差異較大,試卷題量在29~42之間,考試時間與試卷題量之比在2.86~4.00之間,題量差距過大,試卷題量與考試時間之比也差距懸殊.以福建省與海南省、廣西柳州市與甘肅平涼市的中考數學試卷為例,題量與考試時間信息見表6、表7.

表6 福建省與海南省中考數學試卷題量與考試時間
從表6可以看出,福建與海南兩個省份同屬東部地區,福建省考試時間為120分鐘,題量為30,海南省考試時間為100分鐘,題量為29,在題量差距不大的情況下,考試時間相差20分鐘.在考場上多出20分鐘的時間,意味著學生的思考時間大不同,足以引起兩個省份的試卷難度差異,可以推斷:福建省試卷得分率高而海南省試卷得分率低.兩地2018年中考數學的學生測試成績,福建省得分率為0.59,海南省得分率為0.49,與上述推斷一致.

表7 廣西柳州與甘肅平涼中考數學試卷題量與考試時間
從表7可以看出,柳州與平涼兩個地區同屬西部,考試時間均為120分鐘,試題總題量分別為32和38,差距較大,同樣長的考試時間,平涼市的學生要多做6道題,盡管6道題可能是很簡單的試題,但也需要一定的時間理解題意、分析問題,之后再進行解答.6道題目的思維量與運算量對試卷整體難度的影響是顯而易見的.可以推斷:柳州市試卷難度小而平涼市試卷難度大.兩地2018年中考數學的學生測試成績,柳州市得分率為0.62,平涼市得分率為0.54,實際數據與上述推斷一致.
關于題量引起的難度變化也存在于每一種題型中.在所選32份中考數學試卷中,選擇題數量在6~16之間,填空題數量在3~12之間,而解答題小題數量在11~26之間,每一種題型中最多題量與最少題量差距更加懸殊,加之題型自身存在難度差異,不同題型的題量不同使得各地數學試卷難度差異很大.以河北省與江蘇省中考數學試卷為例說明,試卷信息見表8.

表8 河北省與江蘇省中考數學試卷題量與時間信息
兩個省份同屬東部地區,考試時間均為120分鐘,試題總題量、解答題量相差不大,在選擇題與填空題中的題量差距很大.選擇題對學生解答試卷的阻力程度相對較小,而填空題相對選擇題的阻力程度要大.選擇題河北省設置16道,而江蘇省只有6道;填空題河北省設置3道,而江蘇省設置10道.兩份試卷在題型中的題量差異帶來了試卷綜合難度的差異.
一次考試中考試時間有限,如何適當控制題量,幫助學生把有限的時間配置到適合自身難度的題目上去,爭取最大化地展現學生的才能是命題面臨的難點[7],也是命題人員在把握試卷難度時必須考慮的重要方面,在試卷難度評估時也不得不加以考慮.
刻畫數學試卷的綜合難度,離不開試題的難度(即試題的內容難度)及其分布,試題內容難度的確定要結合具體的知識點及思維量來判斷,考查不同知識點的試題其運算量、思維量等也不盡相同[7],不同的知識點對于不同水平的學生難度也不同,但不同難度水平的試題分布可以調整,并藉此調整試卷綜合難度以適應學生的實際水平.
數學試卷中試題難度分布是指試卷中不同內容難度試題在各難度水平的分布情況,即命題人員設置的試卷中各級難度試題的比例,也就是通常意義下的各級難度試題的分值比例.在數學試卷中試題難度分為易、中、難3個層次,相應難度的題目也稱為基礎題、提高題、見解題.通常情況下,難度在0.7以上的試題為容易題,難度為0.4~0.7的試題是中等題,難度在0.4以下的試題為難題,試卷由3種難度的試題組成.中國中考數學試題難度比例的設置目前沒有明確規定,根據中考數學考試評價的目的,有幾種試題難度分布類型,易中難的比例分別是6∶3∶1或7∶2∶1或8∶1∶1,有研究對這3種比較常用的試題難度分布運用數理統計的方法進行了研究,肯定了其合理性[8].
已收集到的32份中考數學試卷的難度分布中,各地的數學試卷試題難度分布大都集中在7∶2∶1和6∶3∶1兩種,不同試題難度比例之下,呈現出的試卷難度也不同.題量固定時,容易題型設置過多則對中等學生和能力較強的學生不易鑒別,中等難度題設置過多則沒有照顧到薄弱學生的水平,對能力較強的學生也不能很好地鑒別;難題設置過多則中等和薄弱學生的水平不易鑒別.中考試卷中有的試卷簡單題目設置較多,而有的試卷較難的題目又設置得過多,易中難試題比例不協調,由于試題難度分布而引起的試卷難度變化是實際存在的.以上海市和山西省為例,上海市命題組對試卷的難度比例設置為8∶1∶1,山西省試卷難度比例設置為6∶2∶2,很明顯,上海市試卷容易題設置過多,中等難度題較少;山西省試卷容易題設置較少.從試題難度比例上反映出,上海市試卷對學生解答試題的阻力較小,而山西省試卷對學生解答試題的阻力較大,這樣的試題難度分布體現出試卷對學生完成答卷的阻力不同,因而影響試卷的綜合難度.
在一份數學試卷中,試卷的閱讀量可以用整份試卷中文字及符號字符數的多少來刻畫,字符數包括試卷中出現的所有的中文、英文、數學符號等,不包括圖形和標點符號.試卷閱讀量的大小取決于試卷中每道試題閱讀量的大?。谝恍┰嚲碇袑Σ糠衷囶}的描述或背景介紹使用了大量的筆墨,以文字語言為主,輔以符號語言.學生解答時必須讀懂題,充分理解試題中的數學術語及關系以及文字、圖形、符號的含義等,完成文字語言與符號語言的互譯,才能運算求解[9-10].這些字符增加了題目語義信息的復雜性,需要學生對語意信息非常敏感,對信息區分策略使用非常靈活,增加了問題表征的難度,因此也增加了試卷的難度[11].
統計了32份中考數學試卷的字符數及平均閱讀量,見表9.中考數學試卷的字符數在1?605~3?693之間,平均2?515個字符,考試時間多為120分鐘,平均閱讀量約為每分鐘21個字符.字符數最少的試卷每分鐘13個字符,字符數最大的試卷每分鐘31個字符.

表9 中考數學試卷字符數
中考數學試卷中字符數相差巨大,最大字符數試卷與最小字符數試卷的字符數相差2?088,相差的字符數比最小字符數試卷的字符數還多,而最大字符數試卷的閱讀量是最小字符數試卷的閱讀量的兩倍多,以2018年寧夏中考數學試卷為例,試卷字符數為3?228,其中解答題第25題字符數多達1?048,且不包括題目中附的圖形,僅一道題在試卷中所占版面接近A3紙張一面,字符數占試卷總字符數約三分之一.這樣的試題設置(問題表征)語意冗長,關系更加復雜,對其閱讀、理解都需要較好的記憶力和清晰的思路,還要同時進行分析與作答,學生解答時所用時間格外多,難度過大.
對于學生來說,熟悉數學語言(包括文字語言、符號語言、圖形語言)是閱讀、理解和表述數學問題的基礎[12].在解答有一定閱讀量的試題時,學生首先要進行字面的理解,然后對其進行概括、抽象,接著對其做出個人判斷并進行解答.閱讀量大的試卷對學生的數學閱讀、抽象、概括等能力提出了更高的要求,在學生進行理解、分析與解答的每一個環節都設置了障礙.學生如果對題意都無法理解,那么便談不上分析問題、解答題目了;在理解了題意的前提下,如果學生的概括、抽象等能力較弱,仍然不能對題目做出正確解答.可以說,試卷的閱讀量對試題的解答設置了層層障礙,重重阻力,影響著試卷的綜合難度.在試卷命制過程中,可通過設置有一定閱讀量的題目來調控試卷的綜合難度,對試卷難度的評估也應同時考慮這一要素.
數學試卷的新穎性是數學試卷中試題新穎性的整體體現.新穎的數學試題在引導學生構建知識網絡、掌握數學思想方法的同時,有利于發展學生的數學閱讀能力、分析問題和解決問題的能力,有利于培養學生的數學興趣和愛好,也有利于學生創新能力的培養和創新意識的提高[13].試題的新穎性主要體現在試題情境、設問方式、解決思路等方面[14].
新穎的試題情境打破了學生日常解題的思維定勢或思維習慣,解決這類問題需要有新的思路或方法.新穎的設問方式主要有開放式設問、探究式設問、實踐式設問等,試題答案不一定唯一,主要對學生的數學理解及思維的靈活性進行考查[15].學生初次接觸這樣的題目時,在信息提取方面有一定難度,如果學生已有數學知識基礎不夠扎實,缺乏其它學科中的必要知識,或者對實際生活中的數學知識無法進行抽象概括,能否理解題目的意思或許會成為首要問題,要解決問題則難度更大.試卷中試題獨特的設問方式則要求學生以相對陌生的思路對試題進行理解、分析與解答,常常會引出不同于平常的解題思路和方法.試題文字語言的呈現、圖表語言及數學語言的創新表達等不僅考查學生提取信息、分析信息的能力,還要求學生對信息進行加工,同樣使得試題難度加大.另外,新穎的數學試卷往往對數學思想方法的運用要求較高,而數學思想方法是數學知識在更高層次上的抽象、概括與提煉,學生一則要熟悉這些思想方法,二則要根據試題情況進行方法的具體選擇,這是一種高水平思維的考查,對學生具有較高的難度,形成的試卷也相對較難[6].
新穎的試題情境和獨具特色的設問方式增加了試題的信息量,使試題變得復雜,其中暗含的數學知識需要學生準確理解并進行數學抽象,向學生提出了靈活思考、創新解法的挑戰,學生需要將已經學習到的數學知識、數學思想及方法融會貫通,需要用不同以往的思維方式與方法去解決數學問題,這樣的試題是學生所不熟悉的,便會阻礙其理解與解答,加大難度[5].
試卷中新穎性試題的設置要考慮其對試卷難度帶來的影響.以山西省中考數學試卷為例,整卷涉及到的情境非常豐富,有快遞、黃河流量、傳統優秀文化、高鐵速度與時間、數學的發現,等等.例如,試卷中19題、21題、22題都比較新穎,既具有開放性,又考查學生的數學閱讀理解能力,而且探究性也很強.然而這些題目同時出現在一份試卷中使得試卷綜合難度過大.2018年山西省中考數學試卷的得分率為0.64,其得分率低的原因主要是試卷閱讀量和試卷的新穎性過大導致試卷難度增加.
學生的實際水平是影響數學試卷綜合難度的關鍵指標.前文論述的5個難度指標屬數學試卷的絕對難度方面,是客體自身所具有的,學生實際水平體現了試卷絕對難度的相對性,實踐主體對難度的影響在此顯現,主客體得以統一.可以說,學生的實際水平是檢驗、調整數學試卷絕對難度的量尺.
由于不同地區學生所處的地域文化不同,社會環境不同,教學條件、師資力量都不盡相同,學生所接觸的信息有差異.在中考命題工作中為使考試更加適切,允許不同省份中考數學試卷不同,甚至同一省份內試卷也有所不同.事實證明學生實際水平指標在試卷綜合難度中起到關鍵作用,選取2018年云南省、溫州市兩地區的中考數學試卷進行了對比.試卷信息見表10.

表10 云南省與溫州市中考數學試卷信息對比
溫州市數學試卷大題數量為24,小題數量為35,云南省數學試卷大題數量為23,小題數量為30,考試時間均為120分鐘.云南省平均每題解答時間為4分鐘,溫州市平均每題解答時間為3.43分鐘.可以看出溫州市試卷較云南省試卷題量略大,學生解答每題時間相對較少.云南省試卷字符數為1?647,溫州市字符數為2?029,相比之下溫州市試卷閱讀量較大.通過征求專家意見判斷試卷中創新性試題占比,云南省沒有創新性試題,溫州市創新性試題占11%.兩地預先設置的易中難比例均為7∶2∶1,試卷中試題難度分布比例相同.但溫州市試卷與云南省試卷在題型順序設置上是存在差異的,前文已有論述.從以上數據看,在前5個難度指標中,溫州市數學試卷有4個指標難度均大于云南省試卷,據此可以判斷溫州市試卷較難,云南省試卷較簡單.但兩地2018年中考數學的學生測試成績,溫州市得分率為0.70,云南省得分率為0.54,與之前的判斷大相徑庭,原因除前文論述中題型順序的差異外,另一主要原因就是學生的實際水平.可以看出,同樣的試卷對不同水平的學生而言難度是不同的,這個不同也可以通過通常意義上的得分率反映出來,這也很好地說明了試卷難度的相對性,凸顯了學生實際水平在試卷綜合難度中的重要地位.
數學試卷綜合難度的內涵及指標體系的建構旨在為數學試卷的評估及命制提供參考.綜上所述,數學試卷綜合難度6個指標從整體著眼到局部關照,克服了內容難度和統計難度的片面性,整體地衡量數學試卷難度.6個指標涉及影響試卷難度的客觀與主觀方面,從關注考試結果的評價轉向關注對命題、組卷的過程性評價.
根據數學試卷綜合難度指標體系,在試卷難度評估、命題過程中綜合考慮試卷客體與實踐主體,以學生實際水平為核心,著力整體布局.題型的選擇要顧及不同水平的學生,同時合理安排題型的呈現順序,控制考試時間、題量.如果試題內容、題型較難,學生所花費的時間較多,可以考慮減少題量或延長時間;如果題量較大,試卷閱讀量較大,學生在有限的時間內思維量、運算量增大,對試題難度分布的調控就很關鍵;而試卷中背景新穎、試題的創新也難以回避試卷閱讀量的問題……總之,試卷難度的評估與預判要綜合考慮6個指標.數學試卷的綜合難度既可用于考試后對數學試卷難度的評估,同時也可用于考試前對數學試卷難度的預估.在考試前的命題、制卷過程中,由于學生的實際水平需要經過實際考試后才能分析得出,可以結合學生往年的考試得分預先估計,再與實際得分相比較分析確定,逐年積累經驗.
研究闡述了數學試卷綜合難度的內涵及其影響要素,從宏觀上為數學試卷難度的評判構建了框架.后續將圍繞每一指標是如何影響試卷綜合難度的,影響的程度大小如何,如何構建刻畫數學試卷綜合難度的模型等問題展開研究.以期對基礎教育階段的試卷難度評估及考試命題工作提供具體的可操作性建議.
[1] 劉怡翔.關于科學技術發展定律的證明提綱——獻給21世紀科學家的一份科學技術的哲學研究報告[J].西安聯合大學學報,2000(3):3–7,45.
[2] 王后雄,汪永鑫.新課程下高考地理考試評價標準及試卷結構技術指標構想[J].課程·教材·教法,2008,28(5):70–75.
[3] 任子朝,陳昂,黃熙彤,等.高考數學新題型試卷質量分析研究[J].數學教育學報,2019,28(1):1–7.
[4] 馮天祥.數學教師的基本功:數學試題的編制[J].課程·教材·教法,2006,26(12):46–48.
[5] 浦高華,薛柯偉.談高考化學試題題型與難度的關系[J].課程·教材·教法,1994,14(6):38–40.
[6] 昌國良.高考數學題的難點與教學導向[J].課程·教材·教法,2007,27(5):40–42.
[7] 呂世虎,孫學敏.中國與新加坡初中數學教材中概率習題的比較研究[J].數學教育學報,2010,19(6):70–73.
[8] 王后雄.高考命題公正的現實困境與兩難選擇[J].教育研究,2008,29(8):24–31.
[9] 任子朝,陳昂,趙軒.加強數學閱讀能力考查 展現邏輯思維功底[J].數學通報,2018,57(7):8–13.
[10] 國家教委考試中心數學試題評價組.數學試題評價報告[J].課程·教材·教法,1996,16(5):11–14.
[11] 岳寶霞,蘇穎,馮虹.題目難度和冗余信息對代數應用題信息區分策略影響的實驗研究[J].數學教育學報,2013,22(6):32–36.
[12] 教育部考試中心.2000年全國普通高考試題分析[J].課程·教材·教法,2001,21(3):47–57.
[13] 呂世虎,王尚志,胡鳳娟,等.《2017年普通高中數學學科教學與評價指導意見》解析[J].數學教育學報,2017,26(6):1–5.
[14] 張夏雨.基于關系—表征復雜性模型的有背景問題難度研究[J].數學教育學報,2010,19(3):46–49.
[15] 呂世虎,王積建.初中數學探究式教學的實驗研究[J].數學教育學報,2005,14(4):35–38.
Conceptualizing and Constructing Indicators for Examining Item Difficulty in Mathematics Tests
LV Shi-hu1, YU Li-fang1, WANG Shang-zhi2
(1. College of Education, Northwest Normal University, Gansu Lanzhou 730070, China;2. Capital Normal University, Beijing 100048, China)
The difficulty of mathematics tests depends on objective and subjective aspects: The objective aspect refers to the difficulty determined by the content and structure of the test as an object, that is, the absolute difficulty; the subjective aspect refers to the difficulty determined by the level of the students as a practice subject, that is, the relative difficulty. The difficulty of mathematics tests is determined by the absolute difficulty and the relative difficulty together. Therefore, this study conceptualized the indicators for examining item difficult in mathematics tests and constructed it by analyzing part of the test items of the senior school entrance exam from the following aspects: The type and order of the test items, the number of test items and the test time, the distribution of the test difficulty, the amount of reading on the test, the originality of the test, and students’ competencies
mathematics test; test difficulty; factor composition
G632.0
A
1004–9894(2020)04–0001–06
呂世虎,于麗芳,王尚志.數學試卷綜合難度的內涵及其指標體系建構[J].數學教育學報,2020,29(4):1-6.
2020–02–04
互聯網教育數據學習分析技術國家地方聯合工程實驗室2019年校企合作項目——數學個性化推薦系統核心資源開發與應用研究(5009-0181)
呂世虎(1963—),男,甘肅平涼人,教授,博士,博士生導師,數學課程標準研制組、修訂組核心成員,主要從事數學課程與教學論、數學教育史研究.
[責任編校:周學智、陳漢君]