(江蘇省蘇州市教育質量監測中心 215000)
教育質量監測是通過科學的手段獲得反映義務教育階段學生學習質量和身心健康狀況以及影響學生發展的相關因素的客觀數據,以全面了解教育質量狀況及其發展趨勢,為各地教育行政部門決策、科學管理提供數據支撐.監測工具的質量對所收集數據和資料的真實性、科學性有重要影響.因此,監測工具的研發和質量分析是教育質量監測中的關鍵環節之一,對監測結果的質量、監測目的的實現都有重要的影響.
蘇州市義務教育學業質量監測工具研發已經過五輪實踐,逐步完善了構建指標體系、制定命題框架、入闈命題研討、組織試測分析、研磨試題工具、學科組卷定稿六個研發流程及研制標準.本文結合典型試題,對2019年蘇州市義務教育學業質量監測八年級數學試卷的特色進行解析,并且與課程標準的一致性問題進行了深入的對比分析,以期為一線教學提供借鑒與參考.
蘇州市義務教育學業質量監測在國家課程標準的基礎上,充分參考借鑒PISA等國際測評先進理念,建立起了“基于課標、關注素養”的監測工具指標體系.其中,數學監測工具的內容維度包括“數與代數”“圖形與幾何”“統計與概率”三個一級指標,能力水平包括“知道事實”“運用規則”“數學推理”“非常規問題解決”四個維度,學科素養包括“數學抽象”“邏輯推理”“數學建?!薄爸庇^想象”“數學運算”“數據分析”六個維度.
蘇州市義務教育學業質量監測既嚴格按照國家標準規范實施,又立足蘇州本土實際開展實踐探索,堅持“培養德智體美勞全面發展的社會主義建設者和接班人”的育人目標,助推全市義務教育的健康發展.

圖1
監測試題命制以全國教育大會精神為指引,認真貫徹 “五育并舉”方針,以我國社會經濟建設中的重大項目和傳統文化的真實情境為載體,情境真實多彩,貼近生活,聯系社會實際,彰顯“四個自信”,落實數學教育中立德樹人根本任務.
試題1如圖1,江蘇省蘇州市現代傳媒廣場的廣電大樓外形酷似“靴子”,造型非常特別.該幾何體的俯視圖為( ).

分析 試題以蘇州廣播電視總臺“靴子”大樓為背景進行設計,賦以幾何體真實背景.從數學角度對建筑的立體構造進行解讀,可以幫助學生認知這個全新幾何體.在解決問題的過程中,學生要借助幾何體的三視圖,這不僅能感受到數學的圖形美,更能感受到這種美對于解決問題的真實力量.試題在考查美育方面進行了大膽的探索,有助于引導學生關注美育,培養審美意識,充分體現了對學生德育的滲透和引導.
從學生的作答情況來看,有86%的學生能正確作答,可見大多數學生能結合實際情境中的不規則幾何體抽象出常見基本圖形,對基本知識的掌握達到了熟練運用的水平.
試卷以監測指標體系為依據制定試題命題框架,落實質量監測評價體系的具體要求,以數學基礎知識為載體,重點考查學生的理性思維和邏輯推理能力,突出學科素養導向,將基礎性和創新性作為重點要求,考查目標明確,重點突出.
試題2楊師傅應客戶要求加工4個長為 4 cm、寬為3 cm的矩形零件.在交付給客戶之前,楊師傅需要對4個零件進行檢測.根據零件上的檢測結果,下列圖形中,有可能不合格的零件是( ).

分析 試題以生活中“零件達標檢測”問題為載體,考查學生對矩形知識的掌握與運用水平.和常規方式不同,試題以零件示意圖上標注的邊角信息的條件,要求學生能運用矩形的判定方法來判斷四邊形零件是否合格.試題再現了技工師傅勞動實踐的場景,直觀新穎、貼合實際,既引導學生關注勞動、尊重勞動、參加勞動,又讓學生充分感悟數學基礎知識、領會數學思想方法、激發數學學習興趣、完善數學思維品質.
從學生的作答情況來看,近54%的學生不能正確回答.分析學生解題思考的障礙主要有兩個:一是看不懂示意圖中的數值和直角標記的意義;二是知道意義但無法和所學知識聯系起來.因此,在日常教學中教師既要注重對基本概念、定理的教學,也要注重對實際問題中幾何圖形一般表達形式的理解.
試卷突出綜合性和應用性,試題設置的情境真實、貼近生活,試題設計融入學生學習、生活的每一個場景,具有濃厚的時代氣息和鮮明的中國特色,也體現了數學知識和方法在解決現實問題中的巨大價值和作用.
試題3美團外賣招聘外賣送餐員,送餐員的月工資由底薪1 000元加上外賣送單補貼構成(送一次外賣稱為一單),外賣送單補貼的標準如下:

外賣送單數量補貼(元/單)每月不超過500單6超過500單但不超過750單的部分a超過750單的部分10
(1)若某“外賣小哥”4月份送餐400單,則他4月份的工資總額為多少元?
(2)設5月份某“外賣小哥”送餐x單(x>500),所得工資為y元,求y與x的函數關系式;
(3)若某“外賣小哥”5月份送餐800單,所得工資為6 500元,求a的值.
分析 試題以學生喜聞樂見的生活材料為載體,重點考查了函數中的一次函數在實際問題中的應用,主要涉及一次函數、方程、不等式等知識點,要求學生能根據實際應用問題中的數量關系,抽象出函數模型,并運用函數、方程解決問題.試題考查函數的綜合應用,老題型新設計,學生只要以數學建模一般思路循序分析,抓住數學本質,就能迅速作答.
從學生的作答情況來看,學生從文字描述中抽象函數表達式的經驗還有所欠缺.有 50%的學生能順利解決問題,其余學生主要在外賣送單數量的分類上存在障礙.因此,在教學中,教師既要引導學生閱讀文本、提取有效信息、挖掘蘊含條件,應用所學知識解決有關問題,也要引導學生通過自主探究、合作交流、抽象概括,由感性知識上升到理性認識,經歷用函數模型描述現實世界變量之間關系的過程,提高學生分析問題、解決問題的能力,有效培養學生的數學建模能力.
蘇州市義務教育學業質量監測既嚴格按照國家標準規范實施,又立足蘇州本土實際開展實踐探索.研究監測試卷與課程標準的一致性問題可以幫助教師理解和處理好評價與教學的關系.
·研究對象
選取2019年蘇州市義務教育學業質量監測八年級數學試卷和《義務教育數學課程標準(2011年版)》作為研究對象.
·研究工具

上述公式中n代表二維矩陣中單元格的總體數量,i代表每一個單元格(1≤i≤n),Xi,Yi分別表示兩個矩陣對應單元格的比率值;一致性系數P是介于0到1之間的數,P越大,說明兩者的一致性程度越高.當P=0時,表示兩者完全不一致;當0
·研究過程
(1)確定編碼框架
綜合2019年蘇州市義務教育學業質量監測八年級數學試卷考查的內容,《義務教育數學課程標準(2011年版)》(下稱《課標》)將課程內容劃分為以下3個內容主題,如表1所示.

表1 內容主題分類
《課標》將具體教學目標劃分為:知識技能、數學思考、問題解決、情感態度.考慮到過程目標(如經歷、體驗、探索等),在試卷中反映不多,因此只分析包含認知性內容的結果目標.具體水平劃分和對應的行為動詞如表2所示.

表2 認知水平分類
綜上,構建SEC一致性分析模型如表3所示.

表3 SEC一致性分析的二維框架
注:下稱“主題一:數與代數”為“主題一”,“水平一:了解”為“水平一”(其他類似).
(2)對課程標準和試卷編碼
按照行為動詞對《課標》中的全部內容與要求進行拆分,再根據內容主題的劃分統計出4級認知水平下的知識點數目.以“分式”一節課標的內容要求為例:① 了解分式的概念(主題一,水平一,1次);② 了解最簡分式的概念(主題一,水平一,1次);③ 能利用分式的基本性質進行約分和通分(主題一,水平三,2次);④ 能進行簡單的分式加、減、乘、除運算(主題一,水平三,4次).
然后歸一化計算比率值.下面列出不同主題和水平下知識點個數的二維矩陣,如表4所示.根據表4中的數據,將歸一化后的比率值填入表3所對應的3行4列《課標》矩陣(視為Xi)比率單元格中.

表4 《課標》內容主題下的水平知識點個數
對試卷的具體編碼如下:首先,分析每道試題的考查知識點和考查水平,并劃分到相應內容主題和認知水平下;其次,按照評分標準將試題所考查的某一內容主題和認知水平下的分值填入二維矩陣的相應單元格中.例如:
試題4小麗畫了一個面積為2的正方形,這個正方形的邊長是( ).

分析 了解乘方與開方互為逆運算(主題一,水平一,1次).會用根號表示數的算術平方根(主題一,水平二,1次).最后,計算出每個單元格的分值,將歸一化后的比率值填入表3所對應的3行4列試卷矩陣(視為Yi)單元格中的相應位置.

表5 試卷中內容主題下的水平分值
根據表4和表5計算的數據,可以分別計算出表3對應的《課標》和試卷兩個矩陣對應單元格的比率值Xi和Yi,代入Porter一致性系數計算公式,即可計算出一致性系數.
(1)一致性系數分析
將編碼后的《課標》與試卷各自對應的二維矩陣比率值代入Porter一致性系數計算公式,得到試卷與《課標》的Porter一致性系數約為0.71.由此數據可以看出,試卷與《課標》的Porter一致性系數大于0.5而小于0.8,達到一定程度的一致,但未達到統計學意義上的顯著性,即一致性程度不高.
(2)內容主題分析
將每一主題在《課標》和試卷中的比例以圖2柱形圖的方式表示,以便清晰地對《課標》和試卷在內容主題維度做出直觀的比較.

圖2 內容主題分布比較
總體而言,《課標》和試卷對不同內容主題的考查力度均呈現了正態分布的趨勢,并且兩者的極差都達到了0.4.但是試卷所對應的正態分布的曲線較平滑,而《課標》所對應的正態分布的曲線較陡峭.這說明了在不同的主題之間,試卷的考查比重差別明顯低于或等于《課標》中對三個主題的考查比重差別.在不同內容主題上,《課標》和試卷均以比例值為界線.試卷在主題二上所占的比重高于0.5,在主題三上所占的比重高于0.1,并且在這兩個主題上的占比高于《課標》;然而,試卷雖然在主題一上所占的比重略高于0.3,但是明顯低于《課標》.
(3)認知水平分析
將每一水平在《課標》和試卷中的比例以圖3柱形圖的方式表示,以便對試卷和《課標》在認知水平上做出直觀的比較.

圖3 認知水平分布比較
總體而言,《課標》中最注重的是對水平三的考查,水平一的考查次之,且兩者的差別僅為0.05左右,水平四的考查比重最低,僅為0.17左右.然而,試卷最注重的是對水平三的考查,且該水平的考查遠遠高于《課標》,對其他水平的考查明顯低于《課標》.
(1)總體的一致性情況
由圖2和圖3可見,《課標》的要求重點和試卷的考查重點有差別,并且兩者的一致性系數低于0.8,不具有統計學意義上顯著的一致性.進一步地,由文[4]還可知,即使是高考試卷,如2017年和2018年的全國卷以及浙江卷,其與《普通高中數學課程標準》的一致性系數也僅在0.7左右.這充分說明,無論是質量監測評價試卷還是中考或高考試卷,在考查上既要嚴格基于“課標”,也要緊密結合教學一線的實踐情況.
(2)內容主題上的一致性情況
總體而言,《課標》對不同主題的考查呈現集中趨勢,而試卷對知識內容的考查主要集中在主題二上,對主題一和主題三的考查力度輕于《課標》.
(3)認知水平上的一致性情況
總體而言,《課標》對不同認知水平的考查呈現集中趨勢,且考查重點主要集中在水平一和水平三上.試卷的考查重點完全集中在水平三上,對其他三個水平的考查力度、尤其是水平一,非常輕.同時,在水平四上,《課標》和試卷的差別并不明顯,僅為0.01左右.這反映出在考查要求上,《課標》注重對基礎知識和基本能力的覆蓋率,而試卷則從學生能力培養的角度在編制上更注重難度系數.