王立東,楊 濤,王燁暉,史寧中,宋乃慶,劉曉玫,馬 復
數學學業表現能力測評體系構建——中國義務教育質量監測的實踐
王立東1,楊 濤1,王燁暉1,史寧中2,宋乃慶3,4,劉曉玫5,馬 復6
(1.北京師范大學 中國基礎教育質量監測協同創新中心,北京 100875;2.東北師范大學 數學與統計學院,吉林 長春 130024;3.西南大學 基礎教育研究中心,重慶 400715;4.中國基礎教育質量監測協同創新中心西南大學分中心,重慶 400715;5.首都師范大學 教師教育學院,北京 100048;6.南京師范大學 教師教育學院,江蘇 南京 210046)
從國家層面了解中國數學教育質量整體狀況,有效地測量評價中國數學教育質量狀況是中國義務教育質量監測工作的基本目標.基于2015—2018年兩輪數學學科國家義務教育質量監測的實踐,介紹了作為監測理論框架核心內容的數學表現能力指標體系.其中包括運算能力、空間能力、數據分析能力、推理能力和問題解決能力等多個表現能力維度.在此基礎上,對于該指標體系的構建依據,命題原則及相應的監測結果做出述評.
數學學科;義務教育質量監測;表現能力指標;命題數學;數學表現
為貫徹黨的十八大、十九大精神,落實《國家中長期教育改革和發展規劃綱要(2010—2020年)》關于開展教育質量監測的有關要求,摸清作為中國未來發展和參與國際競爭最重要“家底”的中小學生的發展現狀,進一步促進中國義務教育質量乃至基礎教育質量的提升,根據《中華人民共和國義務教育法》和《國家義務教育質量監測方案》的相關規定,自2015年起,教育部基礎教育質量監測中心(北京師范大學中國基礎教育質量監測協同創新中心)在多年試點監測工作的基礎上,正式在全國32個省、自治區、直轄市及新疆生產建設兵團范圍內周期性地開展了義務教育質量監測工作.目前已完成2015—2017年第一周期[1]和2018年第二周期數學學科監測工作[2].
學業質量監測的有關研究是近年來得到學界廣泛關注的主題[3].研究者基于教育部基礎教育質量監測中心多年試點監測與兩輪數學學科國家義務教育質量監測的理論設計與實踐經驗,向讀者介紹作為監測理論框架核心內容的數學表現能力指標體系的構建依據,命題原則及相應的監測結果與政策啟示等.
在設計教育質量監測的理論框架方面,學界提出了“五個統一”[4]的原則性要求,即,“現實性與前瞻性相統一、政策性和科學性相統一、全面性與指向性相統一、一般性和特殊性相統一、對代表性橫斷數據和縱向追蹤數據均有顯著預測力和規范性與實用性相統一”.在此基礎上,構建數學學科監測的指標體系框架要考慮數學學科自身的特點,體現出數學學科與數學教育的本質要求.在關注學生數學基礎知識和基本技能的掌握的基礎上,同樣要關注學生抽象能力、推理能力和創新能力的發展;還要反映出社會發展對個體素養的要求,引導學生主動建立數學世界與外部現實世界的聯系,使學生充分發展提出問題、分析問題以及用數學思想和方法解決現實生活中問題的能力[5].
在數學監測的指標體系中,特別設置了表現能力指標體系,期望關注數學教育研究的前沿,結合中國數學教育的實際,在全面提高數學教育質量現狀的要求下,指向數學教育的核心育人目標,在兼顧數學學科特殊性的同時,體現育人目標的一般性,期望監測結果能夠為數學教育研究和數學教育政策實踐提供實證基礎.
注重能力導向的數學教學與評價已經形成學界共識[6],構建數學學科能力表現的指標體系框架,成為監測框架構建的核心問題.在有關指標體系的構建過程中,既基于中國數學教育研究相關的理論與實踐成果,也參考借鑒了國際課程與大型測評項目的有關經驗.
1.1.1 中國數學教育的研究傳統
“能力立意”歷來是中國數學教育培養目標的基本出發點之一.著名數學家華羅庚和關肇直于1958年提出:運算能力、邏輯思維能力和空間想象能力是數學的3種基本能力,這種闡述對中國的數學教育,尤其是培養學生的能力起了很大的作用[7].“我國數學教育的追求是:‘在良好的數學基礎上謀求學生的數學發展.’這里的‘數學基礎’,其內涵就是‘三大數學能力’;這里的‘數學發展’是指:提高用數學思想方法分析問題和解決問題的能力,促進學生在德智體各方面的全面發展.”[8]
隨著社會與教育的進一步發展,對“三大能力”的片面強調,使得學校培養出來的學生雖然具有扎實的基礎知識和技能、善于模仿、善于解常規題和競賽題等優點,但學生的創造能力、動手能力、解決實際問題的能力相對較弱[9].對于數學能力結構的理解也得到了較大的拓展,呈現出多維化的特點.
有研究構建了基于“學習—應用—創新”的數學學科能力表現指標體系[3],包括數學學習理解能力、數學實踐應用能力和數學創新遷移能力等問題解決傾向明顯的能力維度.
中小學生的數學能力是一個多維度、多層次的結構系統.中小學生的數學能力可以分為兩個層次.運算能力、空間想象能力、信息處理能力是第一個層次.以第一層次能力的獲得為基礎,學生會逐漸獲得更高級的能力,理性思維方面會發展起邏輯思維能力,實踐操作方面會發展起問題解決能力,這是第二個層次.而模式能力則在這兩個層次之間起著非常重要的橋梁作用[10].
近年來,得到極大發展和政策應用的核心素養理論認為,核心素養是學生在接受相應學段教育過程中,逐步形成的適應個人終身發展和社會發展需要的必備品格與關鍵能力[11].數學核心素養是數學學習者在學習數學或學習數學某一個領域所應達成的綜合性能力.數學核心素養是數學教學應當特別關注的基本素養[5].作為2015—2018年兩輪數學學科義務教育質量監測理論設計依據的《義務教育數學課程標準(2011版)》明確提出10個核心素養,即數感、符號意識、空間觀念、幾何直觀、數據分析觀念、運算能力、推理能力、模型思想、應用意識和創新意識[12].10個核心素養既有內容維度,又有思維考量,這成為近年來中國數學教育課程設計與教學實踐的基本依據.
1.1.2 國際課程與大型測評項目的經驗借鑒
在各國的國家課程中,通常將數學能力的目標置于課程目標框架中十分核心的位置.例如,德國數學課程標準中的小學一般數學能力標準包括:解決問題能力、關聯能力、數學論證能力、數學建模能力、數學描述能力;中學一般數學能力標準包括:數學論證、解決問題、數學建模、數學表征、數學符號、公式以及技巧的熟練掌握以及數學交流.英國國家數學課程規定了學生應掌握的3項數學能力,每個學段的每個不同領域的內容中都有一些標準是按問題解決、交流、推理3項基本能力劃分的.美國數學教師協會在2000年《數學課程標準》提到6項能力,即,數的運算能力、問題解決的能力、邏輯推理能力、數學聯結能力、數學交流能力和數學表示能力.
在國際大型測評項目中,也十分關注能力維度的測評.如PISA2012數學素養模型包括8項數學能力:交流,數學化,表述,推理和論證,設計問題解決策略,運用符號的、正式的、技術的語言,運算以及使用數學工具,細化了數學問題解決過程的方方面面.
依據上述考量,在國家義務教育質量監測的理論框架設計中,特別關注了學生數學學習的能力維度.數學表現能力維度作為數學學科國家義務教育質量監測的核心目標之一,用以刻畫數學學科義務教育質量的現狀,進而為后續的政策建議與質量提升提供依據.基于已有研究成果的啟示、課程標準的要求以及監測工作的實際,在數學監測的理論框架體系中,監測專家團隊構建了一個數學學業表現能力的指標體系框架,作為監測試題研制設計的基本藍圖.
基于以上分析結果,來自全國不同地區的數學教育、數學課程、數學教研等領域的專家團隊經過反復研討、修訂,達成共識:數學學業表現內涵及其測評指標的選取要充分體現義務教育的性質,突出數學教育促進學生發展,尤其是終身發展和適應未來社會發展的核心目標,突出數學的本質特征,關注公民核心素養,體現能力主線,充分發揮數學監測的導向作用.義務教育階段學生數學學業表現是學生獲得全面發展的基本素養,是學生未來生活、工作和學習的重要基礎.數學學業表現是指學生經過一定階段的數學學習后所獲得的數學知識和技能,運用知識和技能解決問題的綜合能力.
同時,由于國家監測的框架設計需要實現政策性和科學性相統一,既要服務于政策,又要來源于政策,還要遵循科學性的原則[1].開展國家數學教育質量測評,不僅要借鑒國際數學教育測評的經驗,更要立足于中國數學教育的現實狀況,體現國家數學教育目標,并對中國數學教育發展起到導向的作用.因此,在整個數學監測研發過程中,主要的依據包括:(1)國家教育方針政策相關規定,(2)《義務教育數學課程標準》的具體內容要求,(3)義務教育中小學十幾套數學教材的深入分析比較結果.通過系統調研、訪談等方式,充分掌握中國數學教育教學發展的實際狀況,尤其是地區差異狀況,以及教育測量評價的基本理論和相關要求[3].
監測能力指標的框架設計首先以國家課程政策文件(《義務教育數學課程標準(2011版)》)的10個核心素養為基礎.這是義務教育學業質量的基本目標.同時考慮到已有研究對于數學基本能力的深入討論(能力的不同維度和不同層級),兼顧服務國家政策的需要(簡明易懂,易于理論解釋與政策應用).將核心素養進行分類整合提取,形成5個基本能力維度.
該框架選取的能力指標包括:運算能力、空間想象能力、數據分析能力、推理能力和問題解決能力(如圖1).各指標的含義和作用如下.
(1)運算能力:主要是指學生能夠根據法則和運算定律正確進行運算,并能理解計算的原理,尋求合理簡捷運算途徑的能力.兼顧核心素養中的數感、符號意識、運算能力等.
運算能力是學生數學思維能力發展的重要基礎,是學生未來生活需要掌握的基本技能之一.
(2)空間想象能力:主要是指對空間圖形的特征和關系進行認識,并利用圖形描述和分析問題的能力.兼顧核心素養中的空間觀念、幾何直觀等.
空間想象能力是人類基本智能形式之一,良好的空間想象能力是認知能力發展的重要體現,培養學生的空間想象能力能夠幫助學生運用空間信息更好地描述、理解、分析和解決問題.
(3)數據分析能力:主要是指知道現實生活有許多問題應當先做調查研究,能夠收集、整理和分析數據,能夠從數據中提取信息并進行簡單推斷的能力.兼顧核心素養中的數據分析觀念.
(4)推理能力:主要包括合情推理和演繹推理能力,合情推理主要指能從已有的事實出發,憑借經驗和直覺,通過歸納和類比等過程推斷某些結果;演繹推理主要指從已有事實(包括定義、公理、定理等)和確定的規則(包括運算的定義、法則、順序等)出發,按照邏輯推理法則進行證明與計算.兼顧核心素養中的推理能力.
推理是數學的基本思維方式,是學生在學習和生活中必須學會和經常使用的思維方式;良好的推理能力有助于學生更好地獲得新知識和新技能,并幫助他們解決生活中的各種問題.
(5)問題解決能力:主要是指學生憑借獨立思考、創造性地運用所學知識和經驗解決非常規問題的能力.兼顧核心素養中的模型思想、應用意識和創新意識等.
問題解決能力是學生創造性思維發展水平的重要體現,培養學生的問題解決能力有助于提升他們的創新意識和實踐能力.

圖1 中國義務教育質量監測數學能力指標體系框架
可以看到前3個基本能力涉及以數學學科的基本知識內容為載體,后2種能力涉及以數學學科的基本思維方式為載體,5個能力的指標體系較為全面地涵蓋了數學核心素養的基本要求,符合數學學科育人的基本目標.
在特定的能力指標框架下,如何研發高質量的測試工具測評學生在5個能力指標上的表現,是義務教育質量監測工作的基本研究問題.
在兩輪的數學監測工作中,結合多名專家意見,除了采用國際上通行的命題原則與命題方法之外,還提出了若干能力測評試題命題的原則與方法.
綜上所述,我院行萬古霉素血藥濃度監測的ICU老年感染患者比例不高,且治療有效率偏低;大部分患者的血藥谷濃度不在有效范圍內,且不同腎功能狀況患者血藥谷濃度的分布有所差異,腎功能異常患者的萬古霉素血藥濃度可能更高。臨床上應重視老年重癥感染患者血藥濃度監測,并根據其血藥谷濃度、腎功能指標等及時調整用藥方案,實行個體化給藥,以提高用藥的有效性和安全性。但本研究的樣本量略少,且患者數據收集路徑過于單一,尚有待后續研究進一步完善。
在能力指標體系及雙向細目表的框架下,利用紙筆測驗的方式考查學生在各個能力指標上的表現是大型教育測評中的基本做法.
從教育教學實踐與命題實踐可以看到,一道具有數學學科意義的數學試題的解答往往涉及多個內容相關能力或思維相關能力,而通常的教育測評要求將能力指標與試題實現一一對應,這種做法雖然在數據分析和學生能力水平估計上較為簡單,但是與學生的實際心理認知過程不符,同時也丟失掉了部分題目信息,影響試題整體的效度.
基于上述考慮,結合多位專家意見,在2018年數學監測的試題研制指南中提出,每道題目所對應的具體能力指標可以設置兩個能力要求.命題者在編碼時需要設定權重,共有3種類型可選:100%—0%,75%—25%,50%—50%.
同時配套研發相應的多維項目反應理論的數據分析方法,以更好地估計學生在各能力水平上的表現.
對于學生問題解決能力的考查歷來是教育測評的難點.特別是教育質量監測中以模型思想、應用意識和創新意識考查為目的的問題解決類題目的命制,更是需要系統的研究與實踐作為基礎的.
常規的數學問題在考查問題解決能力的功能上往往有限.問題不同于考題,好的問題具有啟導性,誘發智力,不斷提出新問題,甚至是無唯一解答的開放題.它反對“單純模仿”,更多從問題情境出發,構造數學模型,提供數學想象,伴以實際操作,鼓勵發散思想,誘發創造能力,把數學嵌入活的認知過程中去,而不是死的知識積累[13].
基于上述考慮,綜合多位專家意見,在2018年數學監測的試題研制指南中提出,用于測量問題解決能力的試題宜單獨命制,強調將數學學習理解能力、數學實踐應用能力和數學創新遷移能力等思維層次的能力蘊含到問題解決能力當中,并結合第一輪監測的命題實踐總結如下具體的、富有操作性的命題原則.
(1)問題解決測量的目標.對于未來數學教學的有所導向性,特別是學生創新能力培養.
(2)問題解決測試題目的基本特征.命題要求基于真實的情境(現實生活情境或者真實的科學問題情境,但不包括純數學問題情境),需要學生對于情境有一個數學化的過程.試題應是非常規的,沒有既定的模式,往往是(但不局限于)結構不良的、有冗余信息的問題.即使是達到課程標準所規定的學業目標的學生,也并非能夠一目了然地、直接地解決問題,而需要有一個自己設計解題策略的數學思維的過程,而不是簡單的回顧、模仿已有的數學問題(如教科書和教輔材料中的常見問題).問題解決命題基于數學知識,但要避免過于依賴具體數學知識,造成測量目標不夠聚焦.問題解決問題測量功能聚焦.例如,2015年測試中,需要問題解決試題設計多個問題,其中第一問往往是常規問題,在本次命題中要規避這種形式.
(3)幾種可能的問題類型(但不局限于這幾個類型).可以考察要求學生說理的問題(應用數學結果決策,如統計決策、評價規則問題);可以考察要求學生基于給定信息材料“提出問題”“提出方案”的問題,但要考慮如何評價學生提出的問題、方案,或者要求學生提什么樣的問題、方案(有難度的,有意義的,容易實施的);也可以考察包括要求學生基于給定信息材料提出數學猜想的問題;要求學生下定義的問題不作為問題解決問題.
2018年7月28日,教育部基礎教育質量監測中心發布了首份中國義務教育質量監測報告.報告指出,首輪義務教育質量監測依據國家課程標準,對采用國際通用的程序和技術方法,將學業表現劃分為4個水平段,分別是:待提高、中等、良好、優秀.監測結果顯示,中小學生數學良好.四年級、八年級學生數學學業達到中等及以上水平的比例分別為84.6%、78.9%,達到優秀水平的比例分別為23.8%、26.7%.
學生數學學業5項能力上,四年級學生達到中等及以上水平的比例分別為運算能力(87.7%)、空間想象能力(82.2%)、數據分析能力(80.2%)、推理能力(82.3%)及問題解決能力(82.2%);八年級學生達到中等及以上水平的比例分別為運算能力(82.8%)、空間想象能力(78.7%)、數據分析能力(74.6%)、推理能力(78.5%)及問題解決能力(76.8%),如圖2.

圖2 四年級和八年級學生數學學業各項能力達到中等及以上水平的比例(%)
可以看到,按照課程標準的相關要求,四年級學生的運算能力水平較高,其它能力水平大體相當,這為后續的相關學習提供了很好的基礎.八年級學生的數據分析能力相對于其它能力較弱,需要在課程政策與教學實踐中加以關注,特別是在國家十分重視大數據的時代背景下.
特別值得關注的是,四年級、八年級學生均在問題解決能力方面取得了較好的成績,結合以往有關研究[7,14],對于中國學生有關能力的擔憂,可以看到,近年來,中國的數學教育工作者在培養學生提高多方面的數學能力上取得了重要的成績,特別是在補齊“能力短板”方面有諸多建樹.
監測同時包括對于32個省級行政區及新疆生產建設兵團的學生數學表現能力測評結果,可以為各省的數學教育教學政策的制定與質量提升提供依據.
數學表現能力指標框架可以直接、高效地評價、監測學生的數學學習狀況,進而反映中國數學教育質量的現狀.
基于5項能力的數學教育質量監測實踐過程建立了系統的監測工具研發,數據分析以及結果報告的規范化原則與流程,為后續“有效推進素質教育的落實,大力促進基礎教育的均衡發展,切實實現教育行政與管理部門決策和管理的科學化、民主化和專業化,提高管理效能”[15]提供了重要的實證支撐.
[1] 教育部基礎教育質量監測中心.中國義務教育質量監測報告[EB/OL].(2018-07-24)[2018-10-30].http://www. moe.gov.cn/jyb_xwfb/moe_1946/fj_2018/201807/P020180724685827455405.pdf.
[2] 王燁暉,張岳,楊濤,等.義務教育數學相關因素監測工具研發的探索與思考[J].數學教育學報,2018,27(5):12-16.
[3] 丁銳,蓋曉松.東北地區某省會城市小學生數學學業質量監測報告[J].數學教育學報,2018,27(4):46-52.
[4] 李勉,張平平,羅良.中國義務教育質量關鍵影響因素監測框架——構建過程中應考慮的若干問題[J].北京師范大學學報(社會科學版),2017(2):37-44.
[5] 楊濤,辛濤,羅良,等.義務教育數學教育質量監測的探索與思考[J].數學教育學報,2018,27(5):1-7.
[6] 曹一鳴,劉曉婷,郭衎.數學學科能力及其表現研究[J].教育學報,2016,12(4):73-78.
[7] 孫宏安.數學能力新探[J].課程·教材·教法,1996,16(7):15-20.
[8] 張奠宙.關于中國數學教育的特色——與國際上相應概念的對照[J].人民教育,2010(2):36-38.
[9] 徐稼紅.“三大能力”與“建模能力”[J].課程·教材·教法,1997,17(11):30-31.
[10] 史亞娟,華國棟.中小學生數學能力的結構及其培養[J].教育學報,2008,4(3):36-40.
[11] 辛濤,姜宇,林崇德,等.論學生發展核心素養的內涵特征及框架定位[J].中國教育學刊,2016(6):3-7.
[12] 中華人民共和國教育部.義務教育數學課程標準(2011年版)[M].北京:北京師范大學出版社,2011:1.
[13] 張奠宙.數學教育改革的十個問題[J].學科教育,1993(3):12-15.
[14] 蔡金法.中美學生數學學習的系列實證研究:他山之石,何以攻玉[M].北京:教育科學出版社,2007:1.
[15] 董奇.構建具有中國特色的基礎教育質量監測體系[J].人民教育,2007(Z2):2-3.
Constructing an Assessment Framework of Mathematical Performance in China National Assessment of Education Quality
WANG Li-dong1, YANG Tao1,WANG Ye-hui1, SHI Ning-zhong2, SONG Nai-qing3, 4, LIU Xiao-mei5, MA Fu6
(1. Collaborative Innovation Center of Assessment of Basic Education Quality, Beijing Normal University, Beijing 100875, China;2. School of Mathematics and Statistics, Northeast Normal University, Jilin Changchun 130024, China;3. Research Center of Basic Education, Southwest Normal University, Chongqing 400715, China;4. Sub-Center of Southwest Normal University of National Innovation of Basic Education Quality Assessment center, Chongqing 400715, China;5. Faculty of Teacher Education, Capital Normal University, Beijing 100037, China;6. Teacher Education College, Nanjing Normal University, Jiangsu Nanjing 210046, China)
At the national level, the basic goal of the National Assessment of Education Quality is to understand the overall quality of national mathematics education as well as to effectively assess and evaluate the quality of national mathematics education. Based on two rounds of the National Assessment of Education Quality-Mathematics from 2015 to 2018, this paper introduces a framework of evaluating students’ performance in mathematics, which is the core content area. It includes computation, spatial visualization, data analysis and interpretation, reasoning, and problem solving. We describe how the theoretical framework was constructed for item development and also report on students’ performance in mathematics.
mathematics; National Assessment of Education Quality; performance indicators; mathematical item development; mathematical performance
2020–03–12
王立東(1983—),男,黑龍江哈爾濱人,博士,主要從事為數學教學論、教育測量評價研究.
G622.4
A
1004–9894(2020)04–0058–04
王立東,楊濤,王燁暉,等.數學學業表現能力測評體系構建——中國義務教育質量監測的實踐[J].數學教育學報,2020,29(4):58-61.
[責任編校:陳漢君、陳雋]