


摘? ?要
問卷編制是數學核心素養評價的重點,通過構建數學核心素養評價框架和編制問卷,并進行預調查問卷的分析與修訂、信效度檢驗,最終正式建立評價問卷。將數學核心素養評價指標確定為6個一級指標、14個二級指標。評價維度確定為數學內容、評價指標、水平、情境、問題類型。評價題型確定為選擇題、填空題、判斷題、解答題、開放型建構題5類。通過實證研究,該問卷能對高中生數學核心素養水平及等級進行有效評價。
關鍵詞
高中生? 數學? 核心素養? 評價問卷
數學核心素養作為一種具有數學特征的必備品格與關鍵能力,對個人和社會發展起到了橫向連通、縱向貫通的作用?!镀胀ǜ咧袛祵W課程標準(2017年版)》[1]提出的數學學業質量標準,為數學核心素養的評價提供了理論依據[1]。評價是為了尋找實際結果與課程目標的差異[2],數學核心素養的評價,旨在了解學生數學核心素養的水平如何,存在哪些不足,通過哪些培養策略能夠得到提高等。自2015年以來,數學核心素養的研究逐步系統、規范,在教育研究、學校課程和學校教學等方面形成了系列研究成果,但數學核心素養的評價研究相對缺乏,也需要通過實證研究對評價問卷的效度進行檢驗和說明。為此,研究者嘗試以高中生為研究對象,在已有研究的基礎上,開發高中生數學核心素養評價問卷,為進一步深入研究提供基礎。
一、數學核心素養評價框架的建構
1.概念界定
數學核心素養可以理解為:學生應具備的適應終身發展和社會發展需要的、與數學相關的必備品格和關鍵能力。其核心要點為:學生學習數學之后形成的、具有數學學科特點的關鍵成就,是數學學科育人價值的集中體現;學生進行數學學習所必須具備的基本專業素質,其以內隱、穩定的方式存在于主體之中,是數學基礎知識、基本技能、基本經驗、基本思維品質、基本態度、價值觀的有機融合。數學核心素養概念的界定,有利于進一步明確數學核心素養評價的目標,也便于分解評價指標。
2.評價指標的確定
在研究中,將數學核心素養的評價確定在6個一級指標(數學抽象、邏輯推理、數學建模、數學運算、直觀想象、數據分析),14個二級指標(數學表征、抽象思考;合情推理、演繹推理;問題提出、模型建構、解釋驗證;運算法則、運算策略;幾何直觀、空間想象;獲取數據、加工數據、解釋數據)[3]。
一方面,由于數學核心素養評價不同于普通的數學測試,所以先分析確定數學核心素養評價二級指標在評價模型中的權重,以構建較科學、合理的數學核心素養評價體系。另一方面,由于數學核心素養評價更多地體現為一種過程性評價,因此,有必要關注高中生在每個評價指標上的發展水平,以及高中生在不同發展水平(知識技能水平、問題解決水平、綜合發展水平)上的素養表現。
3.評價維度的建立
首先,建立高中生數學核心素養評價框架,主要包括5個維度:數學內容、評價指標、水平、情境、問題類型維度。其次,根據《普通高中數學課程標準(2010年版)》確定數學核心素養評價測試問卷所涵蓋的內容主題,主要包括數與代數、圖形與幾何、統計與概率三個方面。
二、問卷編制
數學核心素養評價測試問卷的大部分試題選自國內外已有研究,包括PISA公布的測試樣題、臺灣林福來教授研究團隊公布的數學素養評量樣本試題、數學素養評價博碩論文中使用的試題等[4-7]。這部分測試題由一批優秀的數學教育研究工作者集體研發,不僅經過實證研究的檢驗,而且適用于大范圍素養評價的測試。
《數學核心素養預測問卷(高一~高三卷)》的選題依據即高中數學主要教學內容,每套問卷6道大題,依次考察學生的數學抽象、邏輯推理、數學建模、數學運算、直觀想象、數據分析核心素養。具體而言,每套問卷共包括6個內容主題,有與6個任務情境相關的18道題,問卷總分值為36分,共有選擇題、解答題、填空題、開放型建構題、判斷題、證明題6種題型。
三、預調查問卷的分析與修訂
1.預研究樣本
預研究主要是對問卷的測試內容、題目難度、試題表達方式、解答情況等進行預調查,旨在讓問卷更適合高中生數學核心素養評價。以隨機取樣的方式,在J省選取三個地區、三所學校的2041名高中生作為預研究對象,學校主要集中在主城區,且均為市一級公辦學校。在參加預研究的學生中,男女比例基本相當,年級包括高一~高三,不同年級學生比例也基本相當。預研究時間由各個學校自主安排,學生在規定的時間、地點集中完成測試。共發放問卷2041份,回收問卷2041份。
2.預研究信度與效度檢驗
(1)信度檢驗
信度是測驗可靠性和穩定性的指標,采用內在一致性信度測量方法,對《高中生數學核心素養預測問卷》進行信度檢驗,內在一致性系數反映的是量表內部的一致性,即項目同質性。檢驗結果表明,《高中生數學核心素養預測問卷(高一~高三卷)》三份問卷信度分別為:0.714、0.711、0.718,部分問卷指標內部一致性系數在0.8以上,有些指標項目需要修訂??傮w而言,預測卷能夠基本達到預期的評價目的。
(2)效度檢驗
①內容效度
內容效度(content validity)研究的目的是要評估測試題是否充分代表了所要評價的內容范圍,它所關注的是數學核心素養評價的內容方面。主要通過以下三種方式來驗證數學核心素養預測問卷具有一定的內容效度:第一,預測問卷項目內容的代表性?!皵祵W核心素養”的概念是在閱讀、梳理國內外數學核心素養的相關研究文獻基礎上提出來的,評價指標的確定綜合考慮了數學素養的核心內涵,并結合了指標調查。所以,問卷各個指標的內容,能夠代表數學核心素養的研究主題。第二,預測被試對象的合理性。
問卷指標、內容初步擬定后,以討論班的形式,請數學教育專業的部分教師和研究生評價這些測試題,同時,一線中學數學教師及相關任課教師對測試題的適宜性及可讀性進行了評價,對預測結果進行統計分析和進一步訪談,再次對測試題目進行修改。問卷的修編研究所采用的被試全部是公辦學校中未參加過數學競賽輔導的高中生,具有一定的代表性。第三,預測問卷編制方法的科學性。
《高中生數學核心素養預測問卷(高一~高三)》共18個題項,每個一級評價指標3個題項,分別指向二級評價指標。問卷測試題均以國內外較為成熟的評價測試項目為依據,進行改編,不僅能保證問卷的效度,而且具有一定的科學性。
②結構效度
結構效度就是測驗能說明心理學上的理論結構或特質的程度,研究采用維度分析法考察預測卷的結構效度。以高一問卷為例,考察各指標之間的相關,6個評價指標之間,絕大多數指標兩兩之間的相關達到了0.01的顯著性水平,相關系數在0.148~0.381之間,均為正相關。6個評價指標與總問卷之間的相關在0.399~0.648之間,為中等程度正相關,表明各評價指標與問卷總體評價一致。
高一~高三問卷的統計結果表明,數學核心素養預測卷各指標之間呈中等程度正相關,各指標與總問卷之間呈中等程度正相關,數學核心素養評價各指標與問卷的整體概念一致并且具有獨立的結構內涵;但需在正式問卷中對測試題修改完善,以進一步提高問卷的效度。
在預研究基礎上,我們對測試卷每道題的結果都進行了分析,對問卷題量、試題難度、區分度等都進行了修改完善。
四、評價問卷的正式建立
在前期預研究的基礎上,形成正式問卷《數學核心素養測試問卷(高一卷~高三卷)》。正式卷包括與6個教學任務情境相關的18道題目,問卷內容覆蓋了數與代數、圖形與幾何、統計與概率三個內容領域,每道測試題都對應著不同的內容主題和數學核心素養評價維度。
對數學核心素養測試問卷的試題分布進行分析,三套問卷(高一卷~高三卷)格式、題例基本一致,均以評價指標順序呈現。對數學核心素養測試問卷的水平分布進行分析,了解數學內容、素養水平和題目數量、題型之間的關系。對數學核心素養測試問卷的百分比分布進行分析,了解數學內容、素養水平和數學情境分布情況。與此同時,我們也進行了試題的示例分析和測試題評分標準的統一。
1.試題示例
(1)數學抽象試題示例
試題1:數位色彩? 數學核心素養測試問卷(高三卷)
很多軟件中,都會遇到設定顏色值的問題,十六進制顏色碼就是在軟件中設定顏色值的代碼。在電腦中可用色碼來表示顏色,例如(255,255,255)是指白色、(255,0,0)是指紅色。判斷方法為:3個數字依序代表三個原色光——紅光、綠光、藍光的亮度,(200,0,150)表示紅光200、綠光0、藍光150,合成的顏色是偏紅的紫色。每種原色光的亮度以0-255之間的整數表示,數字越大代表亮度越高。
問題(1):(127,127,127)是指什么顏色?
A.淺藍色? ? ? ?B.中灰色
C.淺灰色? ? ? ?D.中藍色
問題(2):標準黃色可由亮度最高的紅光和綠光合成,請寫出一個“標準黃色”和一個“較偏紅之黃色”的色碼。
問題(3):每種原色光都分別有256種層次,以0-255之間的整數表示。請問:一般電腦屏幕可顯示出多少不同的顏色?
試題評析:該題考查的是高三學生數學抽象核心素養,問題(1)著重于數學表征素養,是一道水平1的測試試題,需要學生從色碼數字中,抽象出顏色的一般規律。問題(2)較之問題(1),是一道反向表征題,素養水平2級,需要學生用數字表征出顏色色碼的結構。問題(3)著重于抽象思考素養,是一道水平3的測試題,需要學生從數量之間的關系之中,抽象出顏色與色碼之間的關系。
(2)直觀想象試題示例
試題5:小小工程師? 數學核心素養測試問卷(高二卷)
魯夫是個電腦程序設計師,已知現在有個科學繪圖程序,只要輸入數學方程式即可自動繪成直角坐標圖形。
問題(1):若是魯夫打了下列四個方程式,則電腦屏幕中的直角坐標平面出現的圖形,會像什么字?
x=0(-3≤y≤3)
y=0(-2≤x≤2)
y=3(-3≤x≤3)
y=-3(-3≤x≤3)
問題(2):若是魯夫想繪出「二」符號,請問他必須寫出哪些方程式,才可以完成這個任務?
問題(3):若是魯夫想繪出「?蛀」符號,請問他必須寫出哪些方程式,才可以完成這個任務?
試題評析:該題考查的是高二學生直觀想象核心素養,問題(1)評價學生幾何直觀素養,是一道水平2的測試題,需要學生利用幾何圖形,數形結合,解決數學問題。問題(2)評價學生空間想象素養,素養水平1級,需要學生利用空間想象,寫出該符號的數學方程式。問題(3)也是評價空間想象素養,是一道水平3的測試題,需要學生數形結合,感知圖形的形態與變化,寫出該符號的數學方程式。
2.測試題評分標準
數學核心素養測試問卷的題型有:選擇題、填空題、判斷題、解答題、開放型建構題5類。前四類有明確的答案,按照評分標準評分即可;后一類屬于開放題,需要獨立研制評價標準。
數學核心素養測試問卷評分標準的研制過程如下:首先,由研究者擬定評分標準;其次,組織高中數學專家教師討論,然后進行修改;再次,進行試評分,根據評分結果,完善評分標準;最后,在對預測問卷進行正式評分時,針對遇到的問題,進行討論修改。
數學核心素養問卷的評價結果主要包括三類:一是該題的解答是否達到了預期的水平等級;二是對題目的解答情況給予評分;三是對題目的完成度,進行代碼評定。
開放建構題評分標準示例
試題3:新聞真假? 數學核心素養測試問卷(高二卷)
信息時代,網絡上各類新聞層出不窮,真假難辨。某網站最新報道:A市某銀行發生一起嚴重的搶劫案,劫匪獨自一人在無任何車輛等交通工具的情況下,劫走現金1000萬元,所有現金均為捆扎整齊的百元人民幣(如圖)。
問題(1):請你判斷該新聞的真假?
試題與評分編碼:
問題(2):請從數學角度(盡可能使用數學式子、數學符號和數學圖形等)論證你的判斷。
試題與評分編碼:
問題(3):基于以上的解答和論證,你能提出哪些新的問題?
試題與評分編碼:
開放型建構題完全是開放性、建構性的,因此,在評分時,主要根據學生解答的情況,通過主觀判斷進行評分,評價的自由度更大一些,對學生的回答情況更多的是質性判斷,量化評分。
五、經驗總結
1.《數學核心素養預測問卷》的編制與試測
在數學核心素養概念的界定,以及數學核心素養評價6個一級指標、14個二級指標確定的基礎上,初步確定高中生數學核心素養評價框架的5個維度:數學內容、評價指標、水平、情境、問題類型維度,共22個觀測點。評價內容主題的選擇,主要來源于高中數學課程內容的三個方面:數與代數、圖形與幾何、統計與概率。
確定了數學核心素養預測問卷的評價框架后,以國內外較大規模數學素養測試樣題為依據,進行了部分測試題的改編,形成《數學核心素養預測問卷(高一卷~高三卷)》,每套問卷包含6個內容主題,有與6個任務情境相關的18道題,問卷總分均為36分,共5種題型:選擇題、填空題、判斷題、解答題、開放型建構題。
2.數學核心素養評價問卷的建立
通過數學核心素養評價的預研究,對數學核心素養評價問卷測試題進行修改,正式建立高中生數學核心素養測試問卷。對問卷的題號、維度、內容領域、內容主題、標題、題型、答案、分值等基本要素進行梳理。
《數學核心素養測試問卷(高一卷~高三卷)》的6個一級評價指標測試題相當;試題分布主要集中在數與代數、圖形與幾何領域,統計與概率方面的題較少;題型以開放型建構題、解答題為主;知識技能、問題解決、綜合發展三種水平的測試題數量相當;測試題情境以教育和職業情境、公共情境、科學情境為主,個人情境次之。
結合數學核心素養評價6個一級指標,給出試題示例,并進行評析,分析試題評價的重點、水平層次以及核心素養指向等因素。通過標準擬定、教師研討、標準完善、討論修改四個環節,制定數學核心素養評價測試題評分標準,以測試問卷的5類題型(選擇題、填空題、判斷題、解答題、開放型建構題)為例,進行7個變量的評定:評價指標、教學內容、水平等級、題型、情境、評分、代碼,以期對高中生數學核心素養進行全面評價。
參考文獻
[1] 中華人民共和國教育部.普通高中數學課程標準(2017年版)[S].北京:人民教育出版社,2018:16.
[2] 施良方.課程理論:課程的基礎、原理與問題[M].北京:教育科學出版社,1996:156.
[3] 陳蓓.高中生數學核心素養評價指標研究[J].教育研究與評論(中學教育教學),2019(09):17-23.
[4] OECD.PISA2015 Draft Collaborative Problem Solving Framework[EB/OL].http://www.oecd.org/pisa/pisa products/pisa2015 frameword
s.htm,2016-06-26.
[5] 林福來.臺灣數學素養評量樣本試題[EB/OL].http://www.wendangku.net/doc/09684806ae1ffc4ffe4733687e21af45b307feef.html
[6]? 蘇洪雨.學生幾何素養的內涵與評價研究[D].上海:華東師范大學,2009:225.
[7] 桂德懷.中學生代數素養內涵與評價研究[D].上海:華東師范大學,2011:316.
[作者:陳蓓(1981-),女,江蘇常州人,江蘇第二師范學院,教學質量監測與評估處,研究員,博士。]
【責任編輯? 郭振玲】