李小鵬 鄧 磊 蔣 敏 游佳雪
(1.西南大學科學教育研究中心,重慶 400700;2.西南大學附屬中學校,重慶 400700)
高考評價體系是深化新時代高考內容改革的理論支撐和實踐指南,是統(tǒng)籌推進高考綜合改革和高中育人方式改革的重要載體,是提升高考治理能力的重要基礎.[1]隨著高考評價體系的實施,高考命題已經從能力立意轉變?yōu)閮r值引領,素養(yǎng)導向,能力為重,知識為基,因此關鍵能力是高考重要的考查目標,是測試和評價的核心指標和因素.[2]關鍵能力——即將進入高等學校的學習者在面對與學科相關的生活實踐或學習探索問題情境時,高質量地認識問題、分析問題、解決問題所必須具備的能力.[3]依據課程標準所構建的物理科關鍵能力為理解能力、推理論證能力、模型建構能力、實驗探究能力、創(chuàng)新能力這5種.
近年來,以高考評價體系為導向的試題研究已成為物理教育領域關注的熱點.此類研究主要涉及:① 依據高考評價體系對試題進行整體的質性和量化評價,[4-5]② 選取“一核、四層、四翼”的具體某一視角對試題進行評價分析.[6-8]這些研究或對某一套特定試卷進行分析,或對同類型的多套試卷進行比較,而從5種關鍵能力的角度對不同試卷進行比較的研究較少.鑒于此,本研究以2021年新高考方案下的5套高考物理試卷(全國甲卷、全國乙卷、湖南卷、河北卷、廣東卷)為研究對象,評析其在5中關鍵能力上的考查差異,旨在全面認識新高考物理試題的關鍵能力考查特點和命題趨勢,以期為師生的教學提供建議.
2021年新高考物理試卷共16套.本研究選擇全國卷(甲卷、乙卷)2套(由教育部考試中心命制)以及作為全國第三批新高考綜合改革“3+1+2”模式的自命題卷(湖南卷、河北卷、廣東卷)3套(由各省考試院自主命制).
本研究采用張春麗[9]給出的5種關鍵能力界定為編碼標準,對2021年5套高考物理試卷中的每道試題進行關鍵能力編碼與統(tǒng)計,如表1所示.

表1 關鍵能力內涵及試題案例

續(xù)表
為了確保編碼的客觀性,編碼人員首先對5種關鍵能力進行了細化,研討5種關鍵能力的具體評價標準;然后各自獨立對5套試卷進行編碼;接著對編碼結果進行一致性檢驗(肯德爾和諧系數(shù)為0.827,顯著性水平小于0.01),說明編碼結果具有很高的一致性;再次組織編碼人員共同討論存在分歧的題目;最后共同確定試題所考查的具體關鍵能力.
確定每道試題所考查的關鍵能力后,將5種關鍵能力所對應試題的分值所占比重對應為能力結構比重,并進行量化統(tǒng)計分析.如湖南卷第1題考查學生理解能力,該題分值為4分,故對應理解能力計4分;若某題同時考查多種能力,按照 “核心關鍵能力與分支關鍵能力各占一半”的原則進行分配,如全國乙卷第21題,該題分值為6分,其所考查的核心關鍵能力——推理論證能力記3分;分支關鍵能力的模型建構能力、理解能力,分別記1.5分.
通過統(tǒng)計5套試卷中各題考查的關鍵能力分值,計算出了5種關鍵能力在各套試卷中的權重.由于全國卷(甲卷、乙卷)和自命題卷(湖南卷、河北卷、廣東卷)的題量和總分各不同:全國卷110分,13題(必考題12道,選考題1道(2選1));自命題卷100分,15題(必考題14道,選考題1道(2選1)).因此,為了保證權重的歸一性,本研究將全國卷按110分計,自命題卷按100分計.
為了呈現(xiàn)5種關鍵能力在5套試卷中的考查情況,本研究繪制了如圖1~圖5所示的柱狀圖,分別呈現(xiàn)5套試卷對5種關鍵能力的考查權重與平均權重.
2.1.1 理解能力
(1)必考內容的理解能力考查差異比較.
5套試卷對理解能力考查并不均衡:全國卷(甲、乙)超過平均權重(0.234),自命題卷都低于平均權重(圖1).獨立樣本t檢驗顯示,全國卷(甲、乙)與自命題卷在對理解能力的考查上存在顯著性差異(p=0.039<0.05).進一步分析顯示,全國乙卷在理解能力的考查上顯著地高于與其他4套試卷(p=0.022<0.05),說明全國乙卷是5套試卷中最關注理解能力考查的.

圖1 理解能力考查權重
在選修3-3中,全國甲卷超過平均權重(0.040),自命題卷與平均權重值相同,全國乙卷低于平均權重.獨立樣本t檢驗顯示,全國卷(甲、乙)與自命題試卷在對理解能力的考查上無顯著差異(p=0.806>0.05).進一步分析顯示,全國甲
(2)選考內容的理解能力考查差異比較.卷在理解能力的考查上非常顯著地高于另外4套試卷(p=0.007<0.01),說明全國甲卷在選修3-3中最注重對理解能力的考查.
在選修3-4中,只有全國乙卷、湖南卷和廣東卷超過平均權重(0.038).獨立樣本t檢驗顯示全國卷(甲、乙)與自命題卷在對理解能力的考查上無顯著性差異(p=0.528>0.05).進一步分析顯示,全國乙卷在理解能力的考查上顯著性高于另外4套試卷(p=0.038<0.05),說明全國乙卷在選修3-4中最注重對理解能力的考查.
綜上,在必考內容上,全國卷與自命題卷對理解能力的考查存在顯著性差異,全國乙卷更加顯著重視對理解能力的考查;在選考選修3-3上全國甲卷、選修3-4上全國乙卷更顯著重視對理解能力的考查.
2.1.2 推理論證能力
(1)必考內容的推理論證能力考查差異比較.
在對推理論證能力的考查上,僅全國乙卷和河北卷高于平均權重(0.256)(圖2).獨立樣本t檢驗顯示,全國卷(甲、乙)與自命題卷對推理論證能力的考查不存在顯著性差異(p=0.796>0.05).進一步分析顯示,全國乙卷在對推理論證能力的考查上顯著性高于另外4套試卷(p=0.022<0.05),說明全國乙卷最重視對推理論證能力的考查.

圖2 推理論證能力考查權重
(2)選考內容的推理論證能力考查差異比較.
在選修3-3上,全國卷(甲、乙)考查權重高于平均權重(0.046),自命題卷都低于平均權重.獨立樣本t檢驗顯示,全國卷(甲、乙)與自命題卷對推理論證能力的考查存在顯著性差異(p=0.026<0.05).進一步分析顯示,全國乙卷在推理論證能力的考查上顯著地高于另外4套試卷(p=0.020<0.05),說明全國乙卷在選修3-3中也最重注對推理論證能力的考查.
在選修3-4上,全國卷(甲、乙)權重高于平均權重(0.042),自命題試卷都低于平均權重.獨立樣本t檢驗顯示,全國卷(甲、乙)與自命題卷對推理論證能力的考查不存在顯著性差異(p=0.093>0.05).進一步分析顯示,全國甲卷在推理論證能力的考查上顯著性高于另外4套試卷,(p=0.015<0.05),說明在選修3-4中全國甲卷最重視對推理論證能力的考查.
綜上,在必考內容上,雖然全國卷(甲、乙)與自命題試卷對推理論證能力的考查不存在顯著性差異,但進一步分析卻顯示全國乙卷更加注重對該能力的考查;在選考內容方面上,全國乙卷(在選修3-3中),全國甲卷(在選修3-4中)最重視對推理論證能力的考查.
2.1.3 模型建構能力
(1)必考內容的模型建構能力考查差異比較.
在對模型建構能力的考查上,全國卷(甲、乙)都低于平均權重值(0.141),自命題卷(湖南卷、河北卷)都高于平均權重(圖3).獨立樣本t檢驗顯示,全國卷(甲、乙)和自命題卷在模型建構能力的考查上不存在顯著性差異(p=0.109>0.05).進一步分析顯示,河北卷在模型建構能力的考查上顯著地高于其他4套試卷(p=0.037<0.05),說明河北卷在必考內容方面最重視模型建構能力的考查.

圖3 模型建構能力考查權重
(2)選考內容的模型建構能力考查差異比較.
在選修3-3中,除了廣東卷外,其他試卷的考查權重值都超過平均權重(0.025).獨立樣本t檢驗顯示,全國卷(甲、乙)與自命題卷對模型建構能力的考查不存在顯著差異(p=0.678>0.05).進一步分析顯示,在對模型建構能力的考查上,廣東卷非常顯著低于另外4套試卷(p=0.00<0.01),說明廣東卷應該進一步加大對該能力的考查.
在選修3-4中,只有全國甲卷和河北卷、廣東卷的考查權重超過平均權重(0.029).獨立樣本t檢驗顯示,全國卷與自命題卷在模型建構能力的考查上不存在顯著差異(p=0.416>0.05).進一步分析顯示,全國甲卷在模型建構能力的考查上顯著地高于另外4套試卷(p=0.030<0.05),說明在選修3-4中全國甲卷最重視對模型建構能力的考查.
綜上,在必考內容方面河北卷最重視對模型建構能力的考查;在選考選修3-3中,廣東卷的模型建構能力考查最弱,應該加大力度;選修3-4中全國甲卷最重視對模型建構能力的考查.
2.1.4 實驗探究能力
在實驗探究能力考查上,全國卷(甲卷、乙卷)的考查權重都低于平均權重值(0.147),而自命題卷的考查權重則都超過平均權重(圖4).獨立樣本t檢驗顯示,全國卷在實驗探究能力的考查上顯著地低于自命題卷(p=0.029<0.05),反映出第三批綜合改革“3+1+2”模式的新高考省份更加重視對實驗探究能力的考查,更加關注學生實驗設計能力,數(shù)據的獲取、處理與分析能力.進一步分析顯示,廣東卷在實驗探究能力的考查上顯著地高于另外4套試卷(p=0.024<0.05),由此表明廣東卷最重視該能力的考查.

圖4 實驗探究能力考查權重
2.1.5 創(chuàng)新能力
(1)必考內容的創(chuàng)新能力考查差異比較.
在對創(chuàng)新能力的考查上,只有全國甲卷和廣東卷考查權重超過平均權重(0.094)(圖5).獨立t檢驗顯示,全國卷(甲、乙)與自命題卷在對創(chuàng)新能力的考查上不存在顯著差異(p=0.798>0.05).進一步分析顯示,廣東卷在創(chuàng)新能力的考查上顯著地高于另外4套試卷(p=0.027<0.05),說明廣東卷最重視對該能力的考查.

圖5 創(chuàng)新能力考查權重
(2)選考內容的創(chuàng)新能力考查差異比較.
在選考選修3-3中,自命題卷考查權重值全部超過平均權重(0.018),而全國卷(甲、乙)則都低于平均權重.獨立樣本t檢驗顯示,自命題卷在創(chuàng)新能力的考查上顯著地高于全國卷(甲、乙)(p=0.045<0.05).進一步分析顯示,廣東卷顯著地高于另外4套試卷(p=0.016<0.05),說明自廣東卷在選修3-3中最重視創(chuàng)新能力的考查.
在選修3-4中,只有湖南卷和河北卷考查權重值超過平均權重(0.019).獨立樣本t檢驗顯示,全國卷(甲、乙)與自命題卷不存在顯著差異(p=0.474>0.05).進一步分析顯示,湖南卷在創(chuàng)新能力的考查上非常顯著高于另外4套試卷(p=0.003<0.05),說明在選修3-4中自命題湖南卷最重視對該能力的考查.
綜上,在必考內容方面廣東卷最重視對創(chuàng)新能力的考查;在選考選修3-3中,廣東卷最重視對創(chuàng)新能力的考查;選修3-4中,湖南卷最重視對該能力的考查.
5套試卷對5種關鍵能力考查的平均權重如圖6所示.

圖6 5種關鍵能力考查權重
如圖6所示:理解能力、推理論證能力的考查權重在20%以上,模型建構能力、實驗探究能力的權重在15%左右,創(chuàng)新能力的考查權重僅約11%.單樣本t檢驗顯示,5套試卷在對5種關鍵能力的考查上并無顯著差異(p=0.406>0.05).進一步分析顯示,對推理論證能力的考查顯著地高于其他4種關鍵能力(p=0.037<0.05),表明2021年新高考依舊最注重對推理論證能力的考查,強調學生運用物理規(guī)律和數(shù)學方法確定各物理量之間的定量關系,需要學生通過運算、估算等方法進行科學推理和論證,應用正確的物理觀念思考問題、分析和解決問題,并能把推證過程和結果正確地表達出來.
為了了解5套試卷中5種關鍵能力分值的總體分布是否存在顯著差異,進行了多個獨立樣本的非參數(shù)檢驗,結果顯示(表2)5種關鍵能力的漸進顯著性p值均大于0.05,說明5套試卷在5種關鍵能力的分值分布上無顯著性差異.此外,研究發(fā)現(xiàn)創(chuàng)新能力考查權重最少,也就是說雖然5套試卷對5種關鍵能力在其總體考查分布時無差異,但創(chuàng)新能力與其他能力相比依然存在一定程度的不足,說明試卷對關鍵能力的考查存在差異,應該注重各關鍵能力之間的均衡.

表2 5套試卷考查5種關鍵能力分值的顯著性檢驗
(1)5種關鍵能力考查不均衡.
5種關鍵能力在5套試卷中的考查并不均衡,其中推理論證能力考查最多,其次是理解能力,而模型建構能力和實驗探究能力考查只占15%左右,創(chuàng)新能力考查最少.其中,推理論證能力相較其他4種關鍵能力的考查顯著地高,表明2021年新高考依舊注重對推理能力、分析綜合能力和應用數(shù)學處理物理問題能力考查,而缺乏對創(chuàng)新能力的考查.
(2)5種關鍵能力在必考和選考內容方面存在顯著性差異.
整體來看,全國卷與自命題卷對5種關鍵能力在必考和選考內容方面也存在顯著性差異.必考內容,全國卷在對理解能力的考查上顯著地強于自命題卷,而在實驗探究能力考查上則顯著地弱與自命題卷.選考選修3-3中,全國卷在推理論證能力的考查上顯著地強于自命題卷,但在對創(chuàng)新能力的考查上則顯著弱于自命題卷;選修3-4中,全國卷與自命題卷對各種關鍵能力考查無顯著性差異,考查較為均衡.
(3)5套試卷對5種關鍵能力的考查側重各有不同.
總體而言,全國卷(甲卷、乙卷)在必考內容方面注重理解能力和推理論證能力的考查;在選考內容方面選修3-3中全國甲卷注重理解能力、全國乙卷注重推理論證能力;在選修3-4中全國甲卷注重推理論證能力、模型建構能力,全國乙卷注重理解能力.
在必考內容方面湖南卷對各種關鍵能力考查更加均衡,河北卷注重模型建構能力的考查,廣東卷注重實驗探究能力、創(chuàng)新能力的考查;在選考選修3-3中,湖南卷注重理解能力、推理論證能力的考查,河北卷注重理解能力考查,廣東卷注重創(chuàng)新能力;選修3-4中,湖南卷注重創(chuàng)新能力,河北卷注重推理論證能力的考查,廣東卷注重理解能力、推理論證能力的考查.
(1)統(tǒng)籌設置物理學科關鍵能力考查的均衡性,適當增加對創(chuàng)新能力的考查.
對學生關鍵能力的考查,不能僅僅停留在對知識的理解和推理論證上面,應該加大對學生的創(chuàng)新能力的考查力度.21世紀國家更加提倡創(chuàng)新型人才的競爭,如何培養(yǎng)更多更加具有創(chuàng)新能力的人才,是當前考試需要深度思考的問題.誠然,作為選拔性考試的高考,物理試題主要考查學生的知識理解和推理論證是必要的,但若對模型建構和創(chuàng)新能力的考查比例太低甚至完全缺失,則說明該套試卷的配置不太合理.通過上述比較分析發(fā)現(xiàn),5套試卷對學生創(chuàng)新能力的考查比重普遍偏低,這與高考物理試卷對各種關鍵能力考查的均衡性要求不一致,也與國家所倡導的培養(yǎng)學生創(chuàng)新意識與創(chuàng)新能力的理念有偏差.因此,高考物理試卷應統(tǒng)籌設置各關鍵能力之間的合理梯度,適當加強對創(chuàng)新能力的考查,通過對試題的呈現(xiàn)方式和設問方式進行創(chuàng)新,轉變以往的考查思路與切入點,使試題更加靈活和開放,學生通過發(fā)現(xiàn)問題、提出問題和解決問題,培養(yǎng)學生的問題意識,助力國家培養(yǎng)創(chuàng)新型人才.
(2)深度挖掘高考試卷中關鍵能力的特點,加強關鍵能力與考試內容之間的關系.
充分發(fā)揮高考評價體系對立德樹人、引導教學、人才選拔的積極促進作用,高考是檢查教學質量和人才選拔的重要途徑,如何解決唯分數(shù)論,如何真正實現(xiàn)物理高考試卷選拔人才的有效性?是一直以來高考命題研究者思考的問題.因此,深度挖掘高考試卷中關鍵能力的命題特點和規(guī)律,明確關鍵能力考核的標準,真正實現(xiàn)人才選拔時達到所應該具有的關鍵能力.高考物理科命題依據課程標準,貼近中學物理教學實際,創(chuàng)設典型的問題情境,考查學生對基本物理概念、物理規(guī)律的理解和掌握,引導教學遵循教育規(guī)律,回歸課程標準和教材.[10]更加關注傳統(tǒng)文化和科技發(fā)展,貼近學生生活實際,減少試題陌生感,讓學生的獲得感更強,結合中學的實際教學情況,明確每道試題所考查學生的具體關鍵能力.在教學中,教師應該讓學生經歷物理概念、物理規(guī)律的建構過程,再現(xiàn)物理思想與方法,培養(yǎng)學生理解能力;引導學生在真實驗中進行科學推理和論證,激發(fā)學生科學探究的興趣,培養(yǎng)學生推理論證和科學探究能力;增加真實情境培養(yǎng)學生創(chuàng)新能力.
(3)積極開發(fā)多類型試題資源,同時兼顧關鍵能力考查的公平性.
高考需要客觀公正地考查學生關鍵能力.由上述分析發(fā)現(xiàn),由于經濟、教育、文化等發(fā)展的差異,我國當前的高考物理試題類型具有多樣化的特點,5套試卷對5種關鍵能力考查的分值總體分布無顯著性差異,這在一定程度上說明了高考是當前最具權威性的考試,保證了考試的公平性.因此,我國高考應該積極探索,做到在保證公平性的同時,能夠因地制宜、因時制宜地開發(fā)出多類型試題資源,保證人才選拔的高質量,做到“穩(wěn)中求變”“求同存異”的命題導向,提升命題特色.