張妮 熊若欣 夏海燕 穆佳男
(貴州師范大學 教育學院,貴州 貴陽 550025)
STEM 教學是一種全新的教學實踐。STEM 教學自1986 年被首次提出以來,便迅速受到業界和學界的廣泛關注。國內外研究者對STEM 教學進行了大量實踐探索和創新,然而,仍需系統梳理和總結STEM 教學對學生學習效果的影響。元分析(Meta-analysis)是一種對研究結果進行統計分析的方法,它可綜合已有研究發現,對其相應指標進行更準確、客觀的評估。基于此,本研究擬采用元分析方法,對國內外有關STEM教學實驗與準實驗研究結果進行定量合成,以系統分析STEM 教學對學生學習效果的影響,進而為實施STEM 教學提供參考。
國內外研究者圍繞STEM 教學開展了大量研究和實驗,大致形成3 種結論:(1)STEM 教學能夠有效促進學習效果。張屹等人[1]通過設計和實施跨學科STEM教學,發現STEM 教學可以激發學生的學習興趣。(2)接受STEM教學的學生學習效果只有較小程度的提升,沒有達到顯著影響。有研究者以制作電子音樂鉛筆對為學習內容,選取22 名大學生進行單組前后實驗,實驗結果表明采用STEM 教學前后學生的職業興趣沒有顯著差異[2]。(3)STEM 教學相對于傳統教學在提升學生學習效果方面存在負效應。瑪格麗塔·奧爾蒂斯·羅哈斯(Margarita Ortiz Rojas)等人[3]在大學計算機編程課堂中使用STEM 教學,研究表明STEM 教學不利于提高學生的自我效能感。
學習效果是指學生經過學習后,在學習、發展和表現方面取得的成果,集中體現在知識與理解力、實際能力、態度與價值觀等方面的發展。已有研究使用元分析將學習效果劃分為以下兩個層面:認知層面主要包括學生學習成績、問題解決能力以及創造力的作用效果;非認知層面主要包括學習動機、學習態度和學習興趣等。本研究進一步將學習效果劃分為認知、能力、情感3 個方面。
部分研究者使用元分析技術來分析STEM 教學對學生學習效果的影響,發現STEM 教學在一定程度上有利于提高學生的學習成績,并對培養學生的創造力和學習興趣具有促進作用。然而,已有研究大多只聚焦于STEM 教學對學生學習效果的某一方面的影響,或僅僅分析在STEM 教學中使用某一種技術或教學方法對學生學習效果產生的影響,尚未從整體上全面地驗證STEM 教學的效果。此外,部分研究對調節變量的考慮不充分,沒有對納入元分析的文獻進行質量評價,異質性分析仍不夠全面,研究過程缺乏穩健性,從而使得研究的可重復性差,且其他研究者難以對其結果進行驗證。因此,設計更為嚴謹規范的元分析研究對已有研究結果進行整合,對STEM 教學對學生學習效果的影響進行全面、深入的探究,可在理論和實踐層面上豐富和充實STEM 教學相關研究。
本研究采用元分析作為主要的研究方法,對STEM教學相關的多項實驗與準實驗研究進行梳理和整合,獲取其效應量,進而對其學習效果進行系統分析與評價。基本流程包括文獻檢索與篩選、文獻編碼、計算效應量、發表偏倚分析和異質性檢驗5 個步驟。
本研究嚴格遵循用于評價元分析質量的“元分析審查表”,將研究過程劃分為文獻檢索、樣本篩選、文獻編碼與質量評估、數據分析4 個步驟。
1.文獻檢索
本研究采用數據庫檢索與引文回溯法相結合的策略進行文獻檢索。兩名研究助理以“STEM 教學”和“學習效果”為關鍵詞,對百度學術、知網和萬方等國內數據庫進行檢索;以“STEM、STEM Education(STEM教育)、STEM Teaching(STEM 教學)、STEM Learning(STEM 學習)、Learning Effect(學習效果)、Study Outcomes(研究結果)、Learning Result(學習成果)、Study Performance(學習表現)”為關鍵詞,對Google Scholar、Springer 和Web of Science 等國外數據庫進行大范圍組合搜索。之后,采用引文回溯法對已知文獻的參考文獻進行篩選補充,并將全部文獻導入EndNote和Excel 軟件,剔除重復文獻,完成初步篩選。
2.樣本篩選
為避免個人主觀意愿,研究助理嚴格遵循研究目的、研究設計和內容等需要進行樣本篩選。最終確定本研究樣本篩選標準如下:(1)文獻發表時間為2000—2022 年,所使用的語言為英文或中文,文獻類型為期刊和碩博論文;(2)研究主題是STEM 教學對學生影響的實驗或準實驗研究;(3)實驗控制條件為無論是否使用盲法,前測差異ES<0.5;(4)實驗自變量為進行或不進行STEM 教學,且實驗組與對照組的樣本量相近;(5)研究數據完整,以便計算出實驗效應量。
依據上述標準,兩名研究助理分別對文獻進行篩選,其中,兩人一致的文章有37 篇,不一致的有10 篇,Cohen Kappa 一致系數為0.75,說明文獻檢索與初步篩選的內在信度很高。最終經過協商后,共得到42 篇文獻作為元分析的樣本。本研究使用PRISMA 流程對文獻進行收集和篩選,如圖1 所示(見下頁)。

圖1 文獻檢索與篩選流程
3.文獻編碼與質量評估
完成樣本篩選后,需對文獻進行特征編碼,以便數據分析。結合研究目標、已有研究和相關標準,本研究的文獻編碼標準如表1 所示(見下頁)。

表1 文獻編碼標準
對全部42 篇文獻進行編碼,總共得到62 項研究結果。兩名研究助理分別對文獻進行編碼,其中,兩人編碼一致的有58 項,不一致的有4 項,Cohen Kappa一致系數為0.93,說明編碼的內在信度較高。經過協商,確定最終文獻編碼結果。
為確保納入文獻具有較高的學術品質和研究價值,用方法學質量評價對其進行評估,結果顯示文獻質量整體中等。具體而言,(1)因納入文獻大多是實驗與準實驗研究,故不存在隨機序列的產生方法及分配隱藏,結果為低風險;(2)大部分研究沒有報告盲法情況,結果為高風險;(3)全部研究均不存在數據缺失,結果為低風險。
4.數據分析工具和指標
本研究選擇StataSE 15 軟件進行數據分析。首先,選取標準化均數差(Standardized mean difference, 簡稱SMD)作為效應量來評估STEM 教學對學習效果的影響程度,采用Cohen 法進行計算,其值為實驗組與對照組的均數差值除以合并標準差的商;然后,采用逆方差加權法進行加權;最后,采用固定效應模型(Fixed effect model, 簡稱FEM)和隨機效應模型(Random effect model,簡稱REM)及敏感性分析來分析納入研究間異質性。
本研究采用漏斗圖進行發表偏倚檢測,以確保元分析結果的準確性和可靠性。如圖2 所示(見下頁),62 個效應量絕大多數均勻分布在漏斗圖的中上部分,初步證明發表偏倚現象不明顯。然后,進行Egger’s 檢驗得到截距a對應的p=0.182>0.05,95%CI=[-4.53,1.11],進一步說明不存在發表偏倚。

圖2 發表偏倚檢測漏斗圖
由于各個研究在樣本特征、研究環境和方法等方面存在較大差異,導致元分析結果存在異質性。因此,需根據納入研究間異質性的情況選取合適的效應模型。通常采用聯合定性測量的Q 檢驗法和定量檢測的I2,當同時滿足p>0.1 且I2≤40%時,采用固定效應模型;反之,則采用隨機效應模型。異質性檢驗結果見表2。其中,p=0.000 且I2=79.6%,說明各研究間存在較大的異質性,因此應選用隨機效應模型,對效應量進行統計和分析。

表2 異質性檢驗結果
為了確保元分析結果的穩健性,需要通過敏感性分析進行結果驗證。首先,在分別剔除每項研究之后,發現效應量仍具有統計學意義,森林圖的方向未發生改變,初步證明元分析結果較穩健。然后,采用Rosentha法計算失安全系數,最后計算結果為596。當失安全系數與納入文獻相比很大時,說明結果較為穩健。以N/(5k+10)指標進行定量判斷,最后計算結果為2.7 >1,進一步說明元分析結果穩健,結論可被推翻的可能性小。
1.STEM 教學對學生整體學習效果具有中等程度的積極影響
從隨機效應模型上來看,62 項研究結果的效應量為0.626,95%置信區間為[0.525,0.727],且效應量顯著性檢驗Z=12.17(p<0.01)。這一結果證明,與傳統教學相比,STEM 教學對學生的學習效果具有中等程度的正向影響。
2.STEM 教學對學生學習效果的影響差異
本研究將學習效果劃分為認知、能力和情感3 個維度,具體結果如表3 所示(見下頁)。(1)認知維度方面,STEM 教學對提升學生的學習成績有正向中等偏大影響,達到顯著水平。(2)能力維度方面,組間效應量Chi2=18.31,p=0.61 >0.05,說明STEM 教學對學生學習的效果在能力維度方面的影響較為穩健,沒有顯著差異;STEM 教學對培養學生的思維能力和創造力有正向中等偏小影響,達到顯著水平;對提升學生的實踐能力有正向中等偏大影響,達到顯著水平;對培養學生的批判性思維有顯著影響未達到顯著水平;對培養學生的問題解決能力有正向較高水平影響,達到顯著水平。(3)情感維度方面,組間效應量Chi2=10.15,p=0.91 >0.05,說明STEM 教學對學生的學習效果在情感維度方面的影響較為穩健,沒有顯著差異;STEM 教學對培養學生的學習興趣和職業興趣有正向中等偏小影響,達到顯著水平;對培養學生的探究精神有正向較高水平影響,達到顯著水平;對提高學生的自我效能感有正向中等偏大影響,未達到顯著水平。值得注意的是,在STEM 教學中,更加強調跨學科整合、創造性解決問題、情境創設和協作學習,這同時也增加了學生的認知負荷。一定程度的認知負荷有利于學生學習效果的提升,而過高的認知負荷會增大學生的精神的負擔。這就要求教師在進行STEM教學時,應理性全面地認識學生在STEM 學習中的認知障礙,并通過控制認知負荷提升學生學習效果。

表3 STEM 教學對學生學習效果的具體表現
1.STEM 教學對不同學段學生學習效果的影響
學習者的認知和心智能力的發展是一個階段性過程。因此,研究對象所處學段不同可能會對STEM 教學的效果產生不同的影響。本研究的結果如表4 所示(見下頁),組間效應量Chi2=46.38,p=0.23 >0.05,說明STEM 教學對各個學段學生的影響較為穩健,沒有顯著差異。各學段的效應量從大到小依次為小學>初中>高中>大學,各學段的效應量均大于0.2。從不同學段來看,STEM 教學對小學生的影響效果最為顯著,且隨著學段的增加影響效果逐漸減小。這是因為小學生所學的知識相對簡單,其學習動機多屬于興趣型,STEM 教學由于其多樣性的課堂活動形式,更加能夠吸引小學生的學習興趣。STEM 教學對大學生影響程度較低,可能是因為大學生的學習習慣已經養成,并且學習目的明確和自學能力較強,所以不容易產生較大的學習改變[4]。

表4 STEM 教學在不同調節變量上的影響差異
2.STEM 教學對不同學科學生學習效果的影響
本研究將科目劃分為科學、數學、計算機編程等12 門,以探究STEM 教學對學生學習效果的影響在不同科目上的差異。從表4 可知,組間效應量Chi2=40.34,p=0.47 >0.05,有顯著差異。各學科效應量均大于0.2,雖然對計算機編程、物理和3D 打印與創意設計科目具有中等偏小的正向促進作用,但其效應量顯著性檢驗p大于0.05,未達到顯著性水平。從不同學科來看,將STEM 教學應用在理科學科中,可以使得抽象的問題更加具體化,更易于學生對內容的理解,同時也可以提高學生對理科學習的興趣[5]。
3.STEM 教學對不同班級規模學習效果的影響
作為影響教學環境的關鍵因素,班級規模在很大程度上能影響學生學習效果。由表4 可知,組間效應量Chi2=50.80,p=0.15 >0.05,說明在STEM 教學中,班級規模對于學生的學習效果的影響較為穩健,沒有顯著差異。在不同班級規模中應用STEM 教學,對學習效果都有正向促進作用且達到顯著水平。從不同班級規模來看,對中規模班級的影響效果最好,這是因為中規模班級的人數適中,比較適合進行協作學習與同伴學習。依據同伴效應原理,同伴之間能共享學習相關信息,相互提供知識和技能性指導,對具體問題解答的正誤做出判斷和糾正[6]。小規模班級由于人數較少,難以開展合作學習;而在大規模班級環境下,教學資源被稀釋,教師鼓勵學生思考、表達和交流的機會減少[7]。
4.STEM 教學對不同實驗周期學習效果的影響
為探究STEM 教學在不同實驗周期上學習效果的差異,本研究劃分了3 個時間段:0 ~3 個月、4 ~6個月和6 個月以上。從表4 可知,組間效應量Chi2=45.12,p=0.31 >0.05,說明在STEM 教學中,不同實驗周期對于學生的學習效果的影響較為穩健,沒有顯著差異。各實驗周期的效應量從小到大依次為:0 ~3 個月<4 ~6 個月<6 個月以上,各學段的效應量都大于0.2,效應量顯著性檢驗p均小于0.05,說明STEM 教學在這3 種實驗周期下都有正向促進作用且達到顯著水平。從不同實驗周期來看,STEM教學的效應量大小與教學周期正相關。因此,研究者在進行STEM 教學實驗時,可以適當延遲實驗干預時間,以充分發揮STEM 教學的優勢。同時,對學生的學習要進行多元化的評價。這是因為,相對于傳統教學,STEM 教學更注重學生在學習中的創新精神與實踐能力,所以多元化評價更符合STEM 教學的特征。
5.STEM 教學對不同教學方法學習效果的影響
為探究STEM 教學對不同教學方法學習效果影響的差異,本研究將教學方法劃分為問題式、項目式、探究式等7 類。從表4 可知,組間效應量Chi2=37.75,p=0.65 >0.05,說明在STEM 教學中,不同教學方法對于學生的學習效果的影響較為穩健,沒有顯著差異。除了混合式,其他教學方法的效應量均大于0.2,對學習效果具有正向促進作用。其中,游戲化教學方法的顯著性檢驗p=0.224 >0.05,未達到顯著水平:探究式和項目式學習的效果最好,因為這兩種學習方式更符合STEM 教學的核心特征,可加強學生在STEM 學習和集成應用方面的能力,進一步激發其學習能動性[8]。值得注意的是,混合式教學法的效應量沒有達到顯著水平,是因為本研究納入采用此方法的文獻較少,同時也反映出此方法運用的學科領域比較單一。
6.STEM 教學對不同教學場所學習效果的影響
為確定STEM 教學在教學場所上的差異性,本研究將教學場所劃分為普通教室和實驗室。從表4 可見,其組間效應量Chi2=39.21,p=0.58 >0.05,說明在STEM 教學中,不同教學場所對于學生的學習效果的影響較為穩健,沒有顯著差異。無論是在普通教室還是在實驗室環境下進行STEM 教學,都對學生的學習效果產生了正向促進作用,且達到顯著水平。從不同教學場所來看,實驗室環境下的效應量高于普通教室環境下的效應量。教學場域是一種特殊的社會場域,作為師生之間和生生之間的聯結紐帶,教師需要對教學中涉及的活動資源和技術進行協調和系統安排,切忌把熟悉和使用實驗室環境中的設備和技術作為教學目的[9]。
在技術方面,本次元分析按照嚴格的檢驗流程,先后進行了發表偏倚檢測、異質性檢驗及敏感性分析,并對檢驗結果進行詳細的討論,確保了本次元分析具有較強的穩健性。本研究為保障納入元分析的文獻具有較高的學術品質與研究價值,制定了嚴格的文獻納入標準,對以往STEM 教學(準)實驗研究結果進行無偏篩選,并對其質量進行全面系統的評估。以上做法可方便其他研究者后期在研究對象、研究標準一致的情況下,使用元分析方法對本研究的結果進行驗證,可保證研究的可重復性。
STEM 教學實踐存在著大量不可控因素,即使是在研究中對相關變量進行了嚴格的控制,同類研究的結果也可能會存在分歧。部分已有研究采用傳統文獻綜述對STEM 教學相關研究進行梳理和概括,其所得到的結論更多依賴于主觀經驗,缺乏客觀性、科學性和可重復性,難以令人信服。本研究在已有研究的基礎上,通過更加規范的文獻篩選標準與質量評估,保證納入元分析文獻的學術價值,從而提高了效應量估計的準確性。以往研究多數只是對某一國家或地區的研究進行分析,且只從某一方面考察STEM 教學對學生效果的影響,難以從整體上對學習效果進行考察,而本研究涵蓋了STEM 教學主題的國內外(準)實驗研究,將學生學習效果劃分為認知、能力和情感3 個方面,基于變量關系和文獻綜述對調節變量進行更全面的選取,接著對其進行異質性檢驗與亞組分析,使得分析結果更加穩健可信。
綜上,本研究可為教育文獻綜述提供方法借鑒,同時為研究者和STEM 教師提供了大量可用于分析的數據,將有助于研究者和實踐者加深對STEM 教學內涵與規律的認知,為開展STEM 教學元分析與STEM教學實踐提供了有價值的參考路徑。
雖然本研究具有較突出的邊際貢獻,但仍存在以下不足:(1)因元分析有嚴格的遴選標準,使得部分研究設計不合理、研究數據不完整的樣本沒有納入分析中,導致本研究納入分析的研究樣本數量稍顯不足;(2)因原始文獻納入的信息所限,所以本研究無法判斷性別、種族、家庭社會地位、實驗地區等調節變量對學生學習效果的影響;(3)本研究未考慮教師在STEM 教學中的態度和能力等因素是否會對學生的學習效果產生影響。在后續研究中可考慮以下方向:(1)持續關注STEM 教學(準)實驗研究的新結論,嚴格遵循元分析文獻遴選標準,進一步擴大元分析樣本數量;(2)根據STEM 教學的特征分析其他調節變量(如性別、種族、家庭社會地位、實驗地區等)的影響及變量間的交叉影響;(3)將STEM 教師所具備的能力、態度等因素納入元分析中,以更加全面、科學地分析和評價STEM 教學的效果。