梁哲,李曼麗
(1.佛山科學技術學院 人文與教育學院,廣東 佛山 528000;2.清華大學 教育研究院,北京 100084)
促進青少年兒童健康成長與全面發展急需扭轉社會的短視與偏見。2012年,世界經濟合作與發展組織(OECD)在《教育公平與教育質量》報告中,將體質健康形象地比喻為海平面下看不見的冰山,會對海平面上能觀察到的學業表現產生影響[1]。體質健康促進是否有益于學業發展?青少年兒童將本應投入學習的時間用于體質健康促進是否值得?隨著跨學科理論的深化與擴展、世界各國大規模體力活動與健康促進的實踐,以及高級定量研究方法與工具的應用,體質健康促進與學業發展逐漸成為青少年兒童發展領域的研究熱點。
通過文獻回顧和邏輯分析等方法,梳理20世紀以來的代表性研究。以“體質”(physical fitness)或“體質健康”(physical health)或“健康促進”(health promotion)與“學業表現/成績/成就”(academic performance /scores/achievement)為檢索詞,在中國知網、Web of Science、Elsevier、PubMed、EBSCO等數據庫檢索可全文下載的同行評議文獻。以校園范圍內的(school-based)體質健康促進與學業的關系為主題,以普通青少年兒童(中小學生)為對象,兼顧國家(地區)、樣本量、被引數等標準進行嚴格篩選,最終獲得代表性中文文獻5篇和外文文獻40篇。根據跨學科理論演進、定量研究方法應用等梳理關系識別、因果推斷、動態跟蹤三大爭論焦點,回應青少年兒童體質健康促進與學業表現的關系問題,提出開展后續研究的針對性建議。
1908年,Yerkes等[2]發現行為表現與生理喚醒存在倒U型關系,即中等程度的生理喚醒有助于達到最佳的行為表現。當喚醒過高或者過低時,行為表現都會相應地下降。倒U型理論的提出引發了學界對一個問題的興趣:增加身體活動(PA)會影響學習嗎?自此,越來越多研究立足于“PA→體質健康→學業表現”,即 PA通過促進體質健康以提升學業表現的生理機制假設,探析青少年兒童體質健康與學業表現的關系。
學業表現與肥胖(超重)顯著負相關、與健康體質和體測達標顯著正相關的假設得到實證研究的支持。
Kim等[3]通過多元線性回歸,分析韓國6 463名五、八、十一年級學生的飲食行為、體質狀況與學業表現的關系,發現一日三餐、身高與學業表現顯著正相關,為規律飲食與堅持體育鍛煉提供了實證支撐。Shore等[4]以賓州566名來自郊區公立學校的六、七年級學生為研究對象,采用單因素方差分析與多元邏輯回歸分析,在模型控制了性別、社會經濟地位(SES)、種族等人口統計學變量后,結果顯示超重學生表現出更多的遲到和缺勤現象,且平均學分績點(GPA)與閱讀能力等級測試得分低于正常體重學生,盡管差異未達到顯著性水平。Chomitz等[5]對1 847名馬薩諸塞州市區中小學生的綜合評估成績進行多元回歸分析,發現體重狀況與數學成績顯著負相關,即超重學生(BMI≥第 95百分位)、臨界體重(第85百分位≤BMI<第95百分位)的數學成績低于健康體重學生,個人體測達標項目越多則通過數學與英語測評的可能性越大。
盡管針對學齡前兒童的研究在數量上不如青少年群體,亦呈現出相近又頗為微妙的研究發現。Datar等[6]分析1998—1999學年美國早期兒童縱向研究幼兒園項目(ECLS-K)數據,發現在學齡前階段,超重幼兒在數學和閱讀成績上不如非超重幼兒,這種差異會延伸至小學一年級;女童在幼小銜接階段從正常體重發展為超重則比男童更可能面臨學業成績下滑的問題;當模型納入SES變量和行為變量,超重與學業成績不再顯著相關。盡管外顯身體形態與學業表現的關系尚無定論,研究者[7]將學業表現不佳理解為外顯身體形態的一種污名化標簽,有必要充分考慮個人行為與心理特征、父母與家庭特征等因素的調節效應。
由于身體形態的外顯特征交織著復雜的心理與社會效應[8],研究者開始關注青少年兒童內隱的身體機能、身體素質單一指標或多項指標,包括心肺/有氧適能(C/AF)、肌肉耐力、柔韌性等。Dwyer等[9]調查了7 961名7~15歲澳洲中小學生,發現其C/AF和肌肉力量測試成績與考試排名顯著相關,表現為排名越靠前的學生,則跑步用時更短、規定時間內完成更多仰臥起坐和跳遠得分更高。在回顧前人研究的基礎上,Santana等[10]指出較多橫斷面研究證實C/AF既單獨又與其他指標共同作用于學業表現。Marques等[11]進一步提出C/AF可能是學業與認知發展的關鍵指標。Castelli等[12]、Bass等[13]分別對伊州中小學生實施FITNESSGRAM體質測試,發現 C/AF較好的小學生有較優的學業表現,有氧耐力跑達標的中學生更可能在標準化考試中達標。Hanses等[14]在線性多元回歸分析的基礎上,通過非線性多元回歸模型揭示堪州低年級小學生的 C/AF與拼寫和數學成績存在顯著正向關聯。Janak等[15]、Dusen等[16]將德州13個學區多達25萬名小學、初中、高中學生研究發現 C/AF越好的學生其成績排名越靠前,9~11年級學生的C/AF與學業存在劑量效應,即C/AF每增加一單位,學業成績有相應的提升。Esteban-Cornejo等[17]通過分析2 038名6~18歲西班牙青少年的體質與學業狀況,發現在控制BMI標準分數、腰圍和體脂率后,C/AF和運動技能既單獨又共同與學生數學和語言成績顯著正相關,而以上兩項能力較差的學生往往是學業后進生,且肌肉力量不單獨與學業表現顯著正相關。Ishihara等[18-19]采用結構方程模型,分別驗證日本男生C/AF、女生身體形態以及體質健康總分對學業表現的直接效應,提供來自亞洲青少年兒童群體的實證支撐。
我國的研究始于20世紀80年代,黃滔[20]對比體育加強班與普通班學生的體質健康與期末考試成績和初中升學情況,發現體育加強班在期末考試和升學方面皆優于普通班。2000年以后,關于體質健康與學業的研究漸增,在研究方法上主要采用小規模的方便性抽樣,對數據進行均值比較和相關分析,如石倩等[21]通過隨機整群抽樣,在山西太原收集正常體重、超重、肥胖小學生有效數據1 552條,對比發現正常兒童學習成績總分顯著高于肥胖兒童。隨著我國學生體質健康標準的嚴格實施、學生體質監測網絡平臺的持續完善等,研究者注重收集第一手的地區全樣本學生管理數據,描述統計肥胖、肺活量不達標、視力不良等問題,采用最小二乘法(OLS)線性回歸驗證體質不佳的學生在學業上不如健康同伴,尤其是女生[22-24]。
關系識別研究傾向于遵循經典的個人行為理論[25],從個人特點或個體層面的影響因素驗證研究假設和揭示解釋機制,關注個人主觀能動性導向的對策建議。不過,該類研究多停留在相關關系識別層面,未觸及教育政策制定與評估最關切的因果關系,且未充分考量個體所處多層級環境因素的綜合作用。在美國學者Bronfenbrener等[26]的生態系統理論啟發下,Mcleroy等[27]提出“個人—人際關系—組織—社區—公共政策” 的公共健康干預五層級模型,Spence等[28]將其發展為PA與體質健康促進模型。研究者在思路上參考生態系統理論,設計以學校為本、整合家庭和社區等資源的青少年兒童發展干預項目,在方法上借鑒計量經濟學的因果推斷方法,如隨機對照試驗(RCT)、工具變量法(IV)、傾向分數匹配法(PSM)等,深入探析校園環境中的體質健康促進是否對學業發展產生因果影響。
RCT作為因果推斷的黃金法則,本質是在真實環境中把研究對象隨機分配至干預組和對照組的實驗設計,能有效解決研究干預的自選擇問題。一項在美國密歇根州某公立學校開展的研究顯示,214名六年級學生被隨機分配至體育教育組(干預組)以及實驗室教育組(參照組),增加體育課時的干預組學生在標準化考試中未出現成績下降的現象[29]。另一項在加拿大溫哥華8所小學開展的為期16個月的“行動學校”項目,隨機設置每周接受校內額外75 min體力活動的干預組(6所學校),與不接受任何干預的參照組相比,干預組既顯著延長了PA時間,又能保持考試成績[30]。
在 PA有益于學業表現的實證基礎上,后續研究積極探索中等至高強度身體活動(MVPA)與學科教學融合的躍動學科課程。Donnelly等[31]選取堪薩斯地區24所小學二至三年級,開展為期3年的“課程中的身體活動”(PAAC)項目,在干預組(14所小學)的數學課上,學生分組圍圈跑或跳,通過計算組別和人數學習乘法;在地理課上,根據教師所說的地名,學生跑或跳至教室相應方位等。結果顯示,每周接受至少75 min MVPA的干預組在BMI上增長少于對照組,各科標準化考試成績顯著優于對照組,尤以數學最明顯。在荷蘭北部開展的“健康進取學校”項目中,研究者從12所小學招募499名二至三年級的學生,以班級為單位隨機分配至干預組的學生接受為期兩年、每年22周、每周3次20~30 min的“健康進取學校”課程,每節課安排10~15 min數學躍動活動和10~15 min語言躍動活動。結果顯示,干預組的BMI無顯著增長且數學統考和單項成績顯著優于參照組,考試成績等同于對照組多接受4個月常規課程所取得的水平[32-33]。
鑒于實施 RCT可能出現參與者對隨機分配的服從問題與“霍桑效應”、干預組對參照組的“溢出效應”、對照組的“約翰亨利效應”、實驗過程的“安慰劑效應”等,基于IV、PSM的準實驗設計廣泛應用于青少年兒童發展研究。
作為克服觀測數據內生性的經典因果推斷方法,工具變量法通過兩階段最小二乘法模型(2SLS)進行估算。選取IV需滿足3個基本條件:與關鍵變量(體質健康)顯著相關、與結果變量(學業表現)不相關、與殘差項不相關,即IV具有嚴格的外生性,既作用于個人的體質健康又免于人為干預[34]。Cawley[35]采用美國早期兒童縱向研究項目(ECLS-K)數據,將美國各州規定的一、三、五年級每周PE時長作為每天PE時長的工具變量,在第1階段計量模型估算每天PE時長對各州規定PE時長的擬合值,將其代入第2階段計量模型估算具有外生性的擬合值對標準化考試成績的影響。結果顯示:州規定課時每增加100 min則該州五年級PE課時相應增加40 min,州規定課時越長則五年級男生的肥胖率越低;PE課時延長不會擠占主科教學時長,且不會影響標準化考試成績。
尋找有效IV并非易事,PSM通過構造合理的參照組解決自選擇偏誤問題,為準實驗設計提供另一種思路。假設將“體質健康不達標”當作一種“干預”,研究者無法比較同一時間節點上同一個體接受干預(不達標)與不接受干預(達標)的差異,只可能在未接受干預的群體中選取特定對象,構建一個在影響干預概率的背景信息(性別、城鄉、SES、學校類型等)分布上盡可能接近干預組的控制組。由于影響干預概率的背景變量不止一個而是一系列,因此要先計算未受干預的個體在背景變量影響下可能接受干預的概率即傾向分數,再通過傾向分數匹配與干預組可比的參照組,那么兩組在學業表現上的差異為干預效應,即不達標對學業表現的影響。Lu等[36]利用臺灣教育面板調查(TEPS)數據,選取學校特征、父母特征、父母與個人教育期望等作為背景變量,通過計算傾向分數匹配體質不達標組與體質達標組,對比分析兩組間的學業差異,得到與歐美主流研究類似的結論,即體質達標初中生的成績更勝一籌。有趣的是:偏胖和偏瘦對男生的成績都有消極影響,而女生成績僅受到偏胖的影響,再次證實了體質與學業關系的性別異質性。
有別于關系識別與因果推斷研究關注單一時間節點的橫斷面數據,動態跟蹤采集具有國家(區域)代表性的、多個時間節點的人群追蹤數據,力圖驗證身體(健康)優勢的持續累積對于扭轉學業(教育)劣勢的積極作用,探析健康促進影響學業表現乃至教育成就的動態變化趨勢,支持健康與教育協同發展長效機制的建立。
長遠來看,體質健康促進對學業發展持續產生積極的作用。Wittberg等[37]對西弗吉尼亞學區公立小學連續3個學年的五年級學生進行為期兩年的標準化考試成績追蹤,在FITNESSGRAM中保持達標的學生優于待達標的學生,偶爾在達標與待達標邊緣徘徊的學生優于長期待達標的學生。London等[38]通過增長模型分析加州兩個學區共1 957名四至九年級學生的整體體質健康與學業表現數據,發現健康保持達標群體與不達標群體在數學和英語標準化測試成績上存在顯著差異,尤其是女生和拉美裔學生,體質健康總評比BMI測量的肥胖更適于預測學業表現,SES帶來的馬太效應表現為高SES學生擁有健康的體質和優良的成績,而低SES學生則健康和成績都較差。Lêscherban等[39]基于美國收入動態追蹤調查橫跨10年的3批3~14歲青少年兒童數據及兒童發展補充數據,提出了學齡期健康與學業表現隨著時間推移而相互作用的實證模型,尤以女生良好的學業表現與體質健康顯著正相關,揭示了保持體質健康對學業表現的積極效應。Suchert等[40]對1 011名13~15歲的德國初中生進行為期1年的跟蹤研究,C/AF與學業成績顯著正相關,初始PA不足但后續達標的學生在學業上出現相應的提升,PA與學業成績的關系受到自我效能調控。Lima等[41]對1 020名丹麥小學生進行為期3年的跟蹤研究,發現安德森測試、折返跑、縱跳高度、體測總分始終與數學和語言標準化考試成績顯著正相關。Pellicer-Chenoll等[42]首次采用基于神經網絡聚類和數據可視化算法的自組織特征映射(SOM),對巴塞羅那5所高中共454名學生為期4年的PA、能量消耗、體質健康、學業表現數據進行非線性分析,構建一個二維空間下的男女性別與高低學業成績交互生成的2×2矩形SOM拓撲結構,清晰地顯示高能量消耗、體質健康良好、BMI屬于正常范圍且學業成績優良的樣本點聚集至一個空間結構,而低能量消耗、體質健康較差、BMI偏高、學業表現不佳的樣本點聚集至另一個空間結構;在4年間,績優生樣本點穩定保持在同一空間結構,少量差生樣本點流動至績優生空間結構的趨勢明顯。
Chen等[43]采集一所臺灣高中669名七年級學生連續3年的體質與學業測評數據,通過線性回歸分析、潛在增長曲線模型證實了 C/AF的改善與學業提升顯著正相關,肌肉耐力、柔韌性與BMI都無顯著相關。Liao等[44]通過分層線性模型分析2009—2011年臺灣高中生3年體質健康變化與大學入學成績的關系,在控制了高一初始體質健康狀況、年齡與SES后,高三體質健康得分每提升1個標準差,則男生和女生的大學入學成績分別提高0.07和0.10個標準差。其中,女生柔韌性每提升1個標準差則大學入學成績提高0.01個標準差,該研究嘗試從腦機制等生理方面以及自尊增強、焦慮消減等心理方面解釋上述性別差異。Hsieh等[45]對臺灣 2009—2013級 5屆共 382 259名初中生C/AF數據與中學基本學力測驗成績進行分析,發現C/AF至少有一個學年達到“非常健康”的學生比從未達到的學生有更優異的測驗成績,且時間保持越久則測驗排名越靠前,尤以初三健康達標的學力效應最明顯,反映出 C/AF對于學業表現的累積效應以及近因效應;C/AF與數學、科學、社會科學成績的正向關聯強于語言類科目。溫煦等[46]以浙江3個城市966名初一學生為對象進行為期兩年的追蹤研究,發現 C/AF水平低的學生相應地學業成績較差,C/AF水平的變化對各科成績存在中等水平的影響效應;超重和身體素質下降對學業成績下降存在輕微的影響效應;結構方程模型驗證了體質健康影響學業表現的間接路徑,執行功能是體質健康促進影響學業表現的中介變量,將解釋機制從生理層面、心理與社會層面拓展至認知層面(體質健康→執行功能→學業表現)。
目前,對于體質健康促進與學業發展的探究,以美國的學者作為主力軍和領跑者,形成了跨學科的研究共同體,歐亞地區的研究興趣與貢獻漸增。從研究選題來看,由PA逐漸精確至客觀測量的MVPA,嚴格區分課前或課后PA、PE與躍動學科課程,同時探析久坐行為、動作技能、C/AF與學業表現的關系。從研究對象來看,聚焦女性、學齡前兒童與低SES等特定群體,兼顧數學和閱讀標準化考試等過程性評價,以及升學考試、學歷和畢業率等終結性評價。從研究方法來看,已有結論多來自橫斷面研究,隨機對照試驗和追蹤研究持續增多,鮮有質性研究。學界對于體質健康促進與學業表現的研究逐漸形成一個新領域,透過不同視角共同描繪著認知地圖。不過,仍有若干方面值得深入探討。
歐美國家主要采用體適能測試評價學生的體質健康狀況,我國大規模的學生體質測評主要依據國家學生體質健康標準,通過每5年一次的全國學生體質與健康調研、每2年一次的全國學生體質健康監測網絡進行評價。然而,通常首選外顯的身體形態尤其是BMI作為體質指標,僅少量研究同時考慮C/AF、肌肉力量等內隱的身體機能與素質指標。盡管BMI易于采集、便于國際對比,僅由BMI測評肥胖乃至體質健康一直備受質疑[47]。從身體形態的測定來看,可綜合胸圍、腰臀比、體脂率等身體成分指標進行評價;從身體機能、素質、活動的測評來看,應用可穿戴運動監測裝備和手機APP等,對個人乃至群體的運動軌跡、運動習慣、能量消耗、健康狀況等各項參數和指標進行數據化,將有助于探索和豐富互聯網+背景下的體質指標操作化。
大部分橫斷面研究僅識別體質健康促進與學業發展的相關關系,因果機制迫切需要進一步探明[48]。在關系解釋上,體質健康促進與學業發展既可以理解為體質健康促進提升學業表現,又可以解讀為學習優異的學生具備較強的自我管控能力與健康資源整合能力,更可能實現體質健康促進。在數理統計上,體質健康促進本身也具有一定的內生性,即體質健康與體力活動極可能受到個人先天特征、后天偏好、家庭和父母等無法觀測的變量或遺漏變量的影響,導致體質健康促進可能與計量模型中的隨機誤差項存在相關,違背了經典假設而無法得到無偏估計。
據此,在方法上通過因果推斷解決內生性問題、在時間上采用多個時間節點的動態跟蹤、在設計上考慮定量與定性相結合的混合研究,探明生理、認知、社會等維度的因果機制,是研究體質健康促進與學業表現,乃至實現健康與教育長遠發展的有效方法。由于教育實驗研究本身存在爭議,采集觀測數據開展準實驗設計研究,日益受到社會科學研究者的青睞。
隨著全球體質健康問題的低齡化趨勢凸顯,近年研究的對象逐漸下移至學齡前兒童,得到與中小學生類似的研究發現,肥胖和超重群體與健康群體之間的學業差距可追溯至幼兒園階段。由于義務教育階段的學業負擔較小,中小學生體質健康促進研究更易獲得家校支持,而面臨升學壓力的高中生則較少參與其中。我國目前正逐步普及高中階段教育,高中生處于青春期的末段,心智漸趨成熟,身體發育即將定型,但是體育尚未被列入高考必考科目,體育課時更容易被主科教學所擠占,學生難以在學習之余充分開展PA。缺少體育考試屏障的高中生更可能受到體質健康問題的困擾,進而影響學業表現。
從教育與社會發展來看,該研究主題日益與公平議題緊密結合,通過健康促進的差距引申出對教育不平等的思考。越來越多的學者強調體質健康促進的積極作用具有累積效應[49],即積極的促進效果會隨著時間而增強。同時,與性別、種族、城鄉、區域、SES等因素有關的異質性極可能導致身體(健康)與學業(教育)優劣勢累積,影響個人畢生發展。在學校范圍內以特定群體為對象實施精準干預,縮小體質健康差距以消弭教育不平等逐漸成為新的價值取向[50]。在我國積極推進基礎教育均衡發展、促進社會公平和諧以及實施健康中國戰略的背景下,充分考慮社會人口學因素具有重要的政策意義和實踐意義。